完美贴文两秒生成!6 款 AI 工具为你提供灵感、快速产制图文

2023 年各式各样 AI 工具百家争鸣,不管你是专业创作者,还是喜欢在社群上与朋友互动,都有内容产制需求,要如何利用这些工具,在社群媒体领域更上一层楼?以下介绍 6 款实用的 AI 图文制作工具,无论是产生贴文提供灵感、产生贴文、图文制作,或是图片去背与调整一应俱全,马上带你来看。…

Google 压箱宝 AI 模型「Gemini」降临!30 项评分直接超越 GPT-4V

  • 多模态 AI 模型可同时理解文字、程式码、声音、图片、影片等内容
  • 32 项 AI 测试中有 30 项评分超越 GPT-4V
  • 分 Ultra、Pro、Nano 大中小三个版本,Nano 小到可以直接装手机上
  • 不仅支援英语还能同时支援多个语种,在不同语种执行效能也能维持一致
  • 大量使用 Google 自家设计的 TPU 训练

原本 Google 传出会延期到明年才发表的全新大型语言模型「Gemini」如期在 12 月初面世!

就如外界预期,Google 呕心沥血推出的 Gemini 是「原生」多模态 AI 模型,可以同时无缝理解、操作包括文字、程式码、声音、图片、影片等多元形式的内容,像是理解图片方面,Google 宣称 Gemini Ultra 可以直接跳过从图片中使用 OCR 理解文字的步骤,就能直接图片内容。

理解能力到底有强?Google 就用了一个图中很简单的例子, 拿了两张非常简单的手绘汽车图问 …

要先锁定消费性产品?Google 延後了「GPT-4 最强敌手」Gemini 发布日期

Google 近日推迟了其用以对抗 OpenAI GPT-4 的「Gemini」的发布日期,可能要到 2024 年第一季才会准备就绪。

Google 原计画在今年 11 月向云端客户提供 Gemini 的存取权限,不过现在根据 The Information 的报导,Google 已将 Gemini 推出日期延後至 2024 年第一季。

Google 在今年 9 月推出了 Gemini 早期版本。 Google 的 Gemini 又被视为是该公司与 OpenAI GPT-4 竞争的关键产品之一,Gemini 的训练量据称是 GPT-4 的两倍之多,备受 Google 内部重视,甚至为此将两个 AI …

用ChatGPT可以练英文口说?使用「voice conversations」让你有个随身家教

ChatGPT的App有一个我很常利用的功能,就是「语音输入」,透过提问时可以语音输入,加上ChatGPT的文字修饰,可以帮我快速记录会议逐字稿,或是记录想法後转成文章、报告(可参考:利用ChatGPTApp写语音笔记,提升输出效率的秘密武器)。而现在ChatGPT的手机App又多出了新功能,不只可以输入,还可以「模拟跟真人进行语音对话」。

近期ChatGPT提供Plus付费用户很多更新,其中一个是行动版本中的「voice conversations」,开启这个功能後,ChatGPT会用一个「模仿真人语气」的AI跟我们进行来回语音对话,我只要直接说出我的提问,ChatGPT就会用拟真语音进行回答。

ChatGPT近期新功能:

  • ChatGPT图文混合提问9种超能力:程式、教育、学习到行销应用
  • ChatGPTDALL-E3的7个特殊AI绘图应用教学,胜过Midjourney

操作过程也非常简单,在一个对话串「右上方」,开启「voice conversations」功能按钮。

图片来源:作者提供

首先是进入「听」的模式,我们可以说出提问,只要停顿久一点,就会送出我们的提问。(所以可以自然对话,而不用繁琐操作。)

图片来源:作者提供

接着ChatGPT会分析刚刚的提问并生成内容,生成後,就会用模仿真人的语气,「说」出回答。然後继续进入听、说循环的问答模式。

图片来源:作者提供

我获得这个功能後实际测试,ChatGPT「模仿真人语气」这一点做得非常棒,不仅口条上像是真的人,而且还会学真人一样停顿、有语助词等等,我们真的可以感觉就像和一个真人聊天一样。并且「voice conversations」支援多国语言,英文、中文等还可以混合对话。

不过,如果只是为了提问与获得回答内容,我觉得还是自己语音输入问题,然後ChatGPT直接用文字回答,整个流程的速度更快,我也能更有效从文字中获得我需要的内容。

这样的话,「voice conversations」可以拿来做什麽应用呢?

於是我想到了一个可能的应用方式,就是把自己其中一个ChatGPT对话频道,设计成「英文会话练习App」。我的想像是:

  • 会有一个英语教练,可以用语音一问一答的方式,问我问题,然後我回答。
  • 教练确认答案後提供修正,继续问下一个问题。
  • 在这样的过程中,复习我需要的英文会话例句。
  • 这整个过程,不是用文字输入,而是用ChatGPT「voiceconversations」功能,实现一来一往的语音对话。

以下就是我实验成功的一个版本,提供有兴趣的朋友参考。

图片来源:作者提供

首先,我们需要先做一些基本设定。

因为ChatGPTApp上的「voiceconversations」速度没有想像中快,来回对话过程其实需要一些时间,AI看似会等生成出完整内容後,才开始说话。所以如果要流畅对话,要注意下面细节:

  • 采用GPT3.5,让内容比较快生成完毕。
  • 无法问太复杂的问题,以及生成太多内容的回答,因为这样AI往往想到一半就会卡住、断掉,或是要等待太久。
  • 如果跟我下面的范例一样,要做英文会话练习,可以到设定中把「Speech-MainLanguage」设定为「English」。
    • 这时候还是可以中英文穿插对话,但主要语言会辨识为以英文为主。

图片来源:作者提供

接着,如何利用ChatGPT设计一个英文对话练习App呢?

首先我使用下面这段提示语,先把我想要练习的「英文对话例句」输入,让ChatGPT先记住,这样等一下才知道要出什麽题目跟我进行会话练习。

我这边用和孩子一起练习英文会话为例子,可延伸参考:「父母如何用ChatGPT设计孩子的英文单字考卷、会话测验学习单?」。

接着,我利用下面的提示语,让ChatGPT学会出题的逻辑:

  • 请AI根据上述例句,自动出生活情境题。
  • 请AI每出一题都等我回答,然後才出下一题。
  • 给他一个出题的范例,让他自己学会出题逻辑。

这部分,先在ChatGPT网页端用文字提问设定完成。…

美拟扩大禁止对中出口辉达高阶AI晶片,含弱化版本A800及H800

(中央社)拜登政府昨(17)日表示,美国计划扩大禁止向中国出口由半导体大厂辉达(NVIDIA)等企业设计的先进人工智慧晶片,防止北京取得美国尖端科技来强化军事发展。

《路透社》报导,美国高阶官员昨晚曾在新闻发布会上形容,这些规定将进一步限制先进晶片及晶片制造工具出口到伊朗、俄罗斯等国家,并将两家涉及先进晶片制造的中国企业列入黑名单。

美国商务部长雷蒙多(Gina Raimondo)昨日表示,新规定目的是藉由解决去(2022)年10月晶片出口管制措施的漏洞,来抑制中国军事发展,未来可能至少每年修正一次。

雷蒙多说,新规定意在限制中国取得可能有助其人工智慧(AI)及精密电脑发展突破的先进半导体,这些技术对中国军事应用而言十分关键。但她强调,美国政府不寻求伤害中国经济。

美国与中国数年来深陷科技战,美国政府去年10月公布晶片出口管制措施,导致这两个超级大国间紧张关系近一步升温。

AI晶片设计巨擘辉达推出的弱化版本A800及H800晶片,符合美国先前宣布的规范,持续销售给中国。同样受规范影响的超微(AMD)已表示,打算采取相同策略。

《路透社》报导,这次新规定为了涵括更多晶片而修改管制范围,辉达的A800及H800晶片将受到影响。美国财经媒体《CNBC》报导,美国高阶官员指称,新规定将限制辉达A800和H800晶片的出口。

不过,这次新规定将豁免用於笔电、智慧型手机及游戏的多数消费类晶片,但部分晶片仍需美国官员发出的许可及通知。

上述官员还指出,新规定还将先进晶片出口应取得许可的要求扩及40多个其他国家。先进晶片有辗转经过这些国家流到中国的风险,且这些国家也受到美国武器禁运的限制。

美国政府也对中国以外的21个国家,祭出取得晶片制造工具应获许可的要求,并扩大对中国的设备禁止出口清单。

新闻来源

  • 美拟扩大禁止对中出口辉达高阶AI晶片 含A800及H800(中央社)

传 Google 将放弃与博通合作,自行开发 AI 晶片

本文来自钜亨网,INSIDE 授权转载。

根据《The Information》周四 (21 日) 报导,Alphabet 旗下 Google 已经讨论最快在 2027 年放弃博通作为人工智慧 (AI) 晶片供应商,倘若成真 Google 将自己设计 Tensor 晶片。另外报导还指出,两家公司就博通晶片收费问题陷入僵局後,Google 高层就订下目标打算放弃博通。

雪上加霜的是,南韩反垄断机构同日宣布,将暂时对博通以及其附属公司处以 191 亿韩元 (合 1,420 万美元) 的罚款,此前博通涉嫌强迫签订一份对电子巨擘三星不利的长期供应协议。另外,美国联邦贸易委员会 (FTC) 将对博通下达纠正命令。

上述消息传出後,博通周四盘前股价下跌 7.41%,每股暂报 769.00 美元。

《The Information》报导提到,Google 自去年以来一直在努力以另一家晶片制造商迈威尔 (Marvell Technology)取代博通,生产一款内部代号为 Granite Redux 的先进晶片。…

追击微软!Google 的 Duet AI 来了,企业用户、开发者都受益

Google 在今天宣布在 Workspace 的应用程式(包括 Gmail、Google 文件、Google 试算表、Google 简报等)推出 AI 助手 Duet AI,任何有付费购买 Google Workspace 的使用者皆可使用。另外,Google 也宣布了 Google Cloud 扩大支援 Duet AI 协作工具。

Duet AI for Google Workspace 现已全面推出

Duet AI 是 Google 在今年稍早举办的 I/O 大会展示过的 AI 助手,可以将所有 Google Workspace 工具变得更智慧、更有创造力,现在可以免费试用。…

施振荣:半导体供应链早已典范转移,美国与台湾竞争「门都没有」

(中央社)电脑品牌厂宏碁集团创办人施振荣26日表示,国际化是台商必修课,美国因为国安考量,推动在美制造半导体,不过供应链早就典范转移,美国半导体要跟亚洲和台湾竞争,「门都没有」,无论文化或各方面条件都不可行。

台商面临国际管理人才不足挑战,施振荣为此发起与美国雷鸟全球管理学院及东吴大学合作,推动半导体产业国际人才培育计画,26日签署合作备忘录,并举办台湾国际化人才研讨会。

施振荣会前接受媒体采访,被问及人工智慧(AI)趋势对台厂的影响时表示,台商在世界上的制造服务占比或许已达7成,一定要国际化,未来一定要透过AI协助,智慧制造变成重要议题,如果有智慧制造,国际化会相对有效一点,所有工厂都要注意这个课题。

施振荣指出,资安是发展AI初期就要注意的问题,但人才不可能被AI取代,因为现在还是大幅缺工,未来对AI人才需求会更多。劳工不该做原本没有附加价值的工作,对於劳工的「再教育」应该要超前部署。

媒体询问对中国景气看法,施振荣认为,经济下坡的时候,是训练人才的最好时机。

施振荣在研讨会演讲表示,国际化是台商必修课,B2C(企业对消费者)挑战更胜於B2B(企业对企业)。制造业除了产线、人的管理之外,还要考虑当地供应链的管理。

他以80年代宏碁B2C国际化经验为例,当时台湾形象找不到好的人才,宏碁塑造全球品牌,打进东南亚市场登上龙头,在欧洲也赢得胜仗;宏碁在美国转亏为盈的关键,是当地总经理由台籍转美籍和欧洲籍,采取「乡村包围城市」的国际化策略。

施振荣说,美国因为国安问题,认为一定要在美国做半导体制造,不过供应链早就典范转移,美国半导体要跟亚洲和台湾竞争「门都没有」,无论文化或各方面条件都不可行。

雷鸟全球管理学院院长卡格拉姆(Sanjeev Khagram)表示,台湾有许多重要的科技公司,例如宏碁、台积电等,雷鸟学院可以做出贡献,协助台湾迈入下一阶段的全球化发展。

东吴大学商学院院长阮金祥指出,台积电已到美国亚利桑那州设厂,透过此次三方合作,可以帮助半导体产业培养与招揽需要的人才。东吴大学商学院过去与雷鸟学院合作16年,培养不少人才,有几位在台积电、艾司摩尔(ASML)等公司任职,现在会更聚焦半导体产业合作。

阮金祥强调,跨国人才的基本门槛是具备语言能力,更重要是有国际观,了解各国文化、政治、经济、法律等,在沟通时能够用对方可以接受或了解的方式进行。台湾员工往往较习惯接受上层指示该怎麽做,美国员工可能更希望知道为什麽这样做,这是到海外设厂需要注意之处。

新闻来源

  • 施振荣:半导体供应链典范转移 美与台竞争门都没有(中央社)

超微CEO苏姿丰旋风来台,带动AI概念股、电子五哥股价齐扬

继图形处理器龙头辉达(NVIDIA)执行长黄仁勳之後,其劲敌超微(AMD)执行长苏姿丰也接续来台,外界预料将再掀起一阵人工智慧(AI)风潮。而AI概念股受到市场投资人青睐,台厂的电子五哥等股价接连上扬,资金外溢到相关零组件、品牌大厂亦接续走高。

苏姿丰旋风抵台

超微半导体执行长苏姿丰来台湾一共5日,行程中除了在南港总部大楼以外,也将出席超微创新日,也预计与和硕(PEGATRON)董事长童子贤、台积电(TSMC)总裁魏哲家等人会面,并同时安排和广达、微星和技嘉等大厂进行会谈,最後在阳明交大接受荣誉博士受奖。

超微成立於1969年,目前是美国一间专注於微处理器及相关技术设计的跨国公司,发展中最大的变化之一是2009年超微分拆将自家晶圆厂的代工业务,成为现今的格罗方德(GlobalFoundries ),转型为无厂半导体公司,仅负责硬体积体电路设计及产品销售业务。

超微产品面向广泛,包含处理器、显示卡、各类电子加速器,还有软体及相关应用程式,应用上在伺服器、商用系统、个人电脑和乙太网路都有着墨,目前被视为人工智慧产业的代表企业之一,和辉达并称GPU双雄。

超微表示,透过三个关键领域:产品、架构和开放生态系,将持续推动AI产业进化。

超微说明,目前它们的技术已经可以驱动几部全球最快的超级电脑,包含:EuroHPC的LUMI超级电脑和橡树岭国家实验室的Frontier系统(第一个突破百亿亿次级运算屏障的系统),即便是最复杂的生成式AI模型,超微的百亿亿次级运算技术,适合提供所需的处理能力。

超微於2020年开始进入快速成长期,市值一翻再翻至今已达到1905.4亿美元。如今受到苏姿丰来台带动,许多台厂是否达到更多订单或者公布其他业者合作,引起市场关注,而许多投资人开始押宝,推升相关概念股飙升。

7月16日,超微资深副总裁暨伺服器事业群总经理Dan McNamara宣布,AMD为全球最高效能与能源效率的数款云端挹注效能,开发更多产品。

Dan McNamara强调,超微云端业务与Google Cloud以及SAP携手合作,促成SAP选用搭载AMD EPYC处理器以执行Business Suite企业软体工作,满足资料中心现代化与精简IT支出的需求,加速实现企业的价值。

苏姿丰带动相关AI概念股上扬

台湾业者电子五哥受到苏姿丰来台带动,广达、仁宝、纬创、英业达以及和硕股价连续走高,尤其是纬创股价上扬4倍,市值从不到2000亿元,突破4000亿元大关,挤进台股市值前20强,由於近日走势波动太大,遭到证交所於7月14至27日限制分盘交易。

此外,相关零组件、半导体材料也跟着水涨船高,例如在全球矽晶圆中美晶、电子科技硬体技嘉、云服务和云计算公司神达都受到市场青睐。

至於品牌大厂如宏碁,近日则宣布与超为合作推出全新电竞显卡 Predator BiFrost Radeon RX7600 8G 与 RX7600 8G OC,就是采用AMD RDNA 3架构、整合型AI功能加强运算效率,今日股价再创新高,早盘以37.5元开出,一度涨停41.25元,股价改写11年新高。

不过,在市场一片热络之际,生成式AI新创公司Stability AI执行长莫斯塔克(Emad Mostaque)日前示警指出,AI潜藏1兆美元的投资商机,但也可能形成史上最大泡沫。

他强调,AI企业若使用AI不当,将会遭受市场惩罚,就像是谷歌(Google)AI聊天机器人Bard为例,先前在发表时给出错误资讯,致使Google市值短短一天内下挫近千亿美元。而投资人在选择投入大把钞票进入股市时,应审慎评估其中风险。

MacWhisper 利用 OpenAI Whisper 技术将音讯影片自动转逐字稿

OpenAI 公司最为人所知的就是 ChatGPT 人工智慧聊天机器人(现在还有人不知道吗?),其实它还有其他也是很强大的专案研究,例如「DALL·E 以描述让 AI 创造图片,也能编辑现有图片呈现逼真效果」或是另一个对语音即时辨识、转为文字档的 Whisper 技术,都是当今 AI 领域的伟大发明,对於使用者来说或许不用很清楚这些技术背後的实际运作方式,只要善用对的工具就能提高工作效率。

本文要介绍「MacWhisper」是一个将录音或影片自动转为逐字稿的 Mac 应用程式,使用的正是 OpenAI 旗下的 Whisper 技术,无论是会议录音、讲座或是任何音讯档都能透过 MacWhisper 快速准确地转换为文字,同时标记时间轴,也能在辨识後直接修正错误的本文段落,支援超过 100 种语言。

更棒的是 MacWhisper 所有辨识、转录工作都在使用者的电脑上进行,不需要让任何资料离开电脑,即使遇到隐私、敏感的资料也很适合透过 MacWhisper 进行转换,应用程式本身有免费和付费 PRO 方案,差异在於可下载的训练模型(Models)大小不一样,即使如此,免费版模型就能获得相当不错的正确性,同时也能在很短时间完成音讯的识别工作。

MacWhisper 适用於 MP3、WAV、M4A、MP4 和 MOV 格式,付费後还能直接贴上 YouTube 影片网址、直接将影音内容转为文字逐字稿,转换後可保存为 SRT、VTT、TXT、CSV、DOCX(付费後还有 HTML、PDF 和 …