MacWhisper 利用 OpenAI Whisper 技术将音讯影片自动转逐字稿

OpenAI 公司最为人所知的就是 ChatGPT 人工智慧聊天机器人(现在还有人不知道吗?),其实它还有其他也是很强大的专案研究,例如「DALL·E 以描述让 AI 创造图片,也能编辑现有图片呈现逼真效果」或是另一个对语音即时辨识、转为文字档的 Whisper 技术,都是当今 AI 领域的伟大发明,对於使用者来说或许不用很清楚这些技术背後的实际运作方式,只要善用对的工具就能提高工作效率。

本文要介绍「MacWhisper」是一个将录音或影片自动转为逐字稿的 Mac 应用程式,使用的正是 OpenAI 旗下的 Whisper 技术,无论是会议录音、讲座或是任何音讯档都能透过 MacWhisper 快速准确地转换为文字,同时标记时间轴,也能在辨识後直接修正错误的本文段落,支援超过 100 种语言。

更棒的是 MacWhisper 所有辨识、转录工作都在使用者的电脑上进行,不需要让任何资料离开电脑,即使遇到隐私、敏感的资料也很适合透过 MacWhisper 进行转换,应用程式本身有免费和付费 PRO 方案,差异在於可下载的训练模型(Models)大小不一样,即使如此,免费版模型就能获得相当不错的正确性,同时也能在很短时间完成音讯的识别工作。

MacWhisper 适用於 MP3、WAV、M4A、MP4 和 MOV 格式,付费後还能直接贴上 YouTube 影片网址、直接将影音内容转为文字逐字稿,转换後可保存为 SRT、VTT、TXT、CSV、DOCX(付费後还有 HTML、PDF 和 …

Google AI 有新招:强化学习训练打扫机器人,清桌子又快又乾净!

Google 团队於近期发表了新论文,透过视觉观察和强化学习(Reinforcement learning)并藉轨迹优化机器人动作,达到零样本(zero-shot)前提下让机器人成功擦拭桌面脏污。

像擦桌面、折衣服等重复性高的任务虽然适合交由机器人,但仍颇具挑战性。例如擦桌子的动作,机器人该如何根据图像来规划出最佳解方?该如何擦拭,以避免洒出来的脏污面积扩散开?又该如何在避免撞到附近障碍物的情况下,到达能擦到桌子的位置?

目前像强化学习等技术有望解决这些复杂的任务,但若要应用在机器人上,则须仰赖收集大量的数据,以及运用准确但昂贵的模型。

因此 Google 团队提出方法是在不需特定任务相关的训练数据下,就能基於图像观察规划出有效的强化学习策略,并零样本的转移此方法至硬体设备,促机器人成功擦拭桌子。

团队透过随机微分方程(SDE),生成了一个 SDE 模拟器,共具有四大功能,分别可描述被擦拭动作推动的乾物件,和在擦拭过程中被吸收掉的液体;同时捕捉到桌面上多个独立的脏污;将脏污与机器人互动後的不确定性模组化;模拟的速度比实际时间快。

SDE 模拟器能进而产生大量用於强化学习的训练数据。团队接着再将强化学习的策略,透过能快速计算底座和手臂关节轨迹的优化工具来执行。团队表示此种方法也可以避免碰撞障碍物,并实现在零经验模拟下将策略部属到真实世界,并已在模拟环境中和实际硬体设备上验证了此方法。

资料来源:Google Research

责任编辑:Jocelyn
核稿编辑:Chris…

Google 将於 Chrome 113 版本正式加入 WebGPU,加快浏览器游戏、机器学习效能

本文来自合作媒体 Mashdigi,INSIDE 授权转载。

Google 稍早宣布将於 Chrome 113 beta 测试版本预设开启 WebGPU 功能,将能让使用者以 GPU 硬体执行更高 3D 图形运算效能,同时也能用於机器学习等运算加速。

WebGPU 是以 API 形式提供使用,并且由超过来自 Mozilla、苹果、Intel、微软等 90 名开发者贡献相关技术、花费 6 年时间打造,让 Chrome 浏览器能以硬体 GPU 进行渲染运算,定位上与 DirectX、Metal、Vulkan 等 API 相同。

而 WebGPU 目前已经在 Chrome 113 beta 测试版本预设开启,并且对应 Chrome …

迎战穆斯林新年商机!2023布局行销抢先看

image source:TenMax提供

文/TenMax

跨境品牌想在东南亚市场,锁定 20 亿潜力买家,必须把握伊斯兰重要节日「开斋节(Eid al-fitr)」,提早规划行销、布局热销档期!

开斋节相当於华人的农历新年、欧美国家的圣诞节,是穆斯林国家最重要的节日,每年节庆时间约落在 4-5 月间。在伊斯兰历法中,每年 9 月是「斋戒月」,穆斯林将於日出至日落期间禁饮、禁食,以实践教义、修养身心;而当斋戒月结束,就将迎来「开斋节」!

正同华人准备春节般,穆斯林会趁斋戒月期间购买许多日用品、食物、新衣与礼品,并在开斋节当日盛大庆祝。据统计,尽管2022 年物价上涨,斋戒月总支出仍较前年增长 9%,是品牌最佳销售期。想要攻略东南亚市场 2023 年开斋节大档商机?今年斋戒月将从 3 月 22 日启动,一直到 4 月 22 日迎来开斋节新年。这篇文章,TenMax 准备了四大消费洞察与行销策略,往下看、带你做足准备:

一、斋戒月 4 大阶段&热门产业:美食、美妆大有商机

随穆斯林生活作息在斋戒月的转变,购物行为也发生变化。在斋戒月开始前两周,为了做好斋戒准备,穆斯林将注意力着重在室内布置与外衣服饰,因此对装饰品与时尚的搜寻兴趣大幅提升,以盛大迎接斋戒月/开斋节。斋戒开始後的第 1-2 周是热销档期,其中又因白天禁食、禁饮,使穆斯林在此期间对美食、烹饪的兴趣更高;到了第 3-4 周,消费者正为了开斋节加紧准备,会看更多美妆时尚、礼品与餐厅的商品资讯;开斋节当日,穆斯林重新恢复往常作息与饮食,想要大啖美食的需求,将使餐厅流量达到巅峰。

根据 Meta 2023 年的报告调查,食品是穆斯林在斋戒月期间最爱购买的商品类型,68% 穆斯林曾购买食物饮品;由於白天无法进食,穆斯林更需要在夜晚快速补充能量,因此点心与外送服务更符合消费需求,38% 穆斯林在斋戒期间买过甜品点心,而曾在斋戒期间享用外送餐点的穆斯林比例,则达到 …

自家员工也不满!Google 职员斥 Pichai 急推 AI Bard 是急躁、糟糕决定

Google 於上周三(8 日)举办了差强人意的 Google 搜寻发表会後,公司内部论坛Memegen 上涌现许多批评领导阶层的评论,尤其是针对 CEO 桑德尔·皮蔡(Sundar Pichai),员工认为 Google 在 Bard 的发表上表现得很「急躁」、「糟糕」且「不符合 Google 风格」。

Google 於上周选择抢先微软 Bing 发表会一步,先宣布推出自家对话式 AI Bard。但到了实际发表会时,用以展示功能的手机却不翼而飞,据称公司内部有些人员甚至不知道这场发布会的存在。

Memegen 是个 Google 职员常以幽默方式来嘲讽公司失误的平台,但外媒《CNBC》表示针对 Bard 发表会事件的评论较以往更加严肃,部分言论甚至直接点名 Pichai。

一名员工写下「亲爱的 Sundar,推出 Bard 和裁员皆是急躁、糟糕的且短视近利的决定」,员工也请 Pichai 重新以更长远的视角来审视公司发展,此言论一出得到许多职员的赞同。

另一个得到高评价的评论为「Sundar 和领导阶层在员工表现评级上应得到最低等级」,「他们目光短浅且不符合 Google 风格(un-Googlely)。」

Google 风(Googlely)一词来自去年 …

【Alphabet 2022 Q4】YouTube 广告表现受经济环境冲击,营收逊於预期

Alphabet 已公布 2022 年第四季的财报,表现未能超过分析师的预期。总营收为 760 亿美元 少於分析师预期的是 765 亿美元,其中 YouTube 广告营收为 79.6 亿美元,不及预期的 82.5 亿美元。 Google Cloud 营收为 73.2 亿美元,少於预期的 74.3 亿美元。而每股盈余为 1.05 美元,同样低於预期的 1.18 美元。

Alphabet 於 Q4 增加了 3,455 人,但公司已减缓了招聘的速度,以确保长期盈利能有所增长。结合了人事成本和官司罚款等因素,Alphabet 营运支出上升了 10% 至 225 亿美元。

YouTube 

YouTube 广告营收较去年同期的 …

YouTube 拟测试以广告支撑、由特定媒体业者提供之内容

本文来自合作媒体 Mashdigi,INSIDE 经授权转载。

《华尔街日报导》指称,Google 正在 YouTube 服务测试由特定媒体业者提供,并且藉由广告支撑播放成本的内容。

类似概念,如同以免费形式提供使用,但是额外透过广告平衡播放成本的串流影音服务 Pluto TV,或是 Roku 旗下藉由广告内容支撑播放成本的即时电视频道,另外像是三星、LG 及 Vizio 在美国境内推行电视产品所附带免费电视频道服务,同样都是藉由广告支撑播放成本。

虽然 YouTube 同样提供以广告支撑播放成本的服务,甚至透过付费加入 YouTube Premium会员身分即可去除广告,但此次传出测试服务内容主要源自与特定媒体合作项目,类似先前已经在美国境内提供以付费方式订阅使用的 YouTube TV 服务。

在 YouTube 服务发言人相关回应中,则是确认目前着手测试此服务项目,预期会在今年进一步扩大推行此服务。而在华尔街日报报导中,更指出 Google 将与狮门娱乐 (Lionsgate)、 A&E 电视网等业者合作,藉此在服务加入更多吸引人观看内容,进而增加更多观看用户族群。

另一方面,相关消息也指出 Google 除了持续与众多电视业者合作 Android TV 或 Google TV 系统,未来也计画与更多电视品牌合作预载其 …

「只是将欧盟裁决复制贴上」 Google 反控印度反垄断机构

本篇来自合作媒体 钜亨网, INSIDE 经授权转载。

根据法庭文件,Google 告诉印度法庭,该国的反垄断调查人员抄袭了欧洲针对这家美国公司滥用其 Android 操作系统市场支配地位裁决的部分内容,并主张撤销该裁决。

印度竞争委员会(CCI)於 10 月对 Alphabet Inc. 旗下的 Google 处以 1.61 亿美元的罚款,原因是其利用其线上搜寻和 Android 应用程式商店等市场的主导地位,并要求其改变对智慧手机制造商施加的与预设应用相关的限制。

消息人士在 10 月透露,Google 对印度的决定感到担忧,因为被要求的补救措施比欧盟委员会 2018 年对 Android 行动装置制造商实施非法限制具有里程碑意义的裁决更为全面。在此案中,Google 对创纪录的 41 亿欧元罚款提出质疑。

Google 在向印度上诉法庭提交的文件中辩称,CCI 的调查部门「大量复制贴上欧盟委员会的一项决定,使用来自欧洲但未在印度审查过的证据」。「有超过 50 次复制贴上」,某些段落「逐字逐句抄袭」,监管机构则是否认这个问题。

文件指出,「CCI 未能进行公正、平衡和合法合理的调查;Google 的行动应用程式上架做法是有利於竞争的,而不是不公平或具排他性的。」

Google …

调查:Facebook 和 TikTok 未能有效移除明显错误的选举资讯

据纽约大学团队 Global Witness and the Cybersecurity for Democracy Team(C4D) 研究显示,两大社群平台 Facebook 和 TikTok 无法有效审查出带有「明显」错误内容的美国期中选举广告。

团队提交了 20 份广告给 Facebook、TikTok 和 YouTube,广告采英文或西班牙文,受众瞄准在亚利桑那州和乔治亚州等摇摆州,而内容以错误的美期中选举资讯为主,像「投票日将延长」、「社群媒体可作为投票人的身分验证」、「选举的结果可能被骇」,以及「结果已事先内定」等。

提交广告给三大平台审核後,TikTok 通过 90% 的错误广告;Facebook 则是通过一定数量的广告,但比例较 TikTok 低一些,而 YouTube 挡下了所有广告,并停用提供错误内容的帐号。审核过程结束後,团队即撤走所有广告,避免平台用户接触到错误资讯。

C4D 团队的带领人 Laura Edelson 表示,YouTube 对广告的审核结果显示,找出有关选举的错误资讯并非不可能的事,团队所调查的社群平台都应该要具备好的表现,因此Edelson 也呼吁 Facebook 和 TikTok 在审核内容上需要改进,并确实在用户接触到前移除假讯息。…

共和党提告 Google!指称 Gmail 刻意将其募款邮件归类为垃圾信

美国共和党全国委员会(Republican National Committee, RNC)在加州向Google提出告诉,指称 Gmail 的垃圾邮件审核机制未公平处理信件,表示共和党寄出的竞选募资信件,较容易被归类为垃圾邮件,而由於 11 月的期中选举即将到来,募资在现阶段是重要的关键。

共和党曾提出相似的指控,而 Google 在今年 8 月时因此提出一项计画,让寄件用户可自行选择文宣不被 Gmail 归类垃圾信,信件中只会改出现告知收件者此信件参与了 Google 计划的通知。不过据消息指出,共和党并未被纳入这项计画中,尚不清楚背後的因素为何。

共和党对於 Google 信件审核机制的不信任,来自於北卡罗来纳州立大学(North Carolina State University)的一项研究,内容指出共和党信件被归类於垃圾信件的机率高於民主党(Democratic Party),但也有人认为该份研究的分析不够严谨。

Google 对於共和党的指控采否认态度,外媒也认为当相似信件一直被寄出,且收件者并未打开这些邮件,就很容易被系统侦测为垃圾信件,所以或许共和党的状况仅是因为他们较不会寄信。…