安全+数智 AI赢未来 C3安全大会·2025盛大启幕——AI XDR开启体系化联动防御新时代CMG 世界机器人大赛今晚开赛,机甲格斗选手准备就绪C919 国产大飞机完成厦门首航,今起在厦沪快线常态化执飞马斯克宣布回归 7x24 小时工作状态,专注于 X、xAI、特斯拉等拥有完全自主知识产权:中国航发 2MW 级纯氢燃气轮机连续稳定运行时长破 7000 小时宝马高性能子品牌 Alpina 创始人家族推出手工定制跑车:基于 M4 打造,极速突破 300km/h京东Joy Inside联手商汤元萝卜 AI下棋“家教”正式上线开源共建智启未来 开源鸿蒙开发者大会2025成功举办微博管理员回应推出“黑粉”标识:纯属 P 图,站内无此标识挑战英伟达垄断地位:和硕展示基于 AMD MI350X 的 1177 PFLOP 级 AI 机架Sensor Tower 报告 4 月全球手游收入:《王者荣耀》强势上升四位,重回榜首微软为 Mesa 3D 图形堆栈贡献超 6 万行代码,推出全新 Gallium3D 前端除 Mac Studio 外,苹果曾考虑将 M3 Ultra芯片应用到 MacBook Pro 中从华为智能电动DriveONE运动域看新能源汽车行业发展困境与破局之道埃克塞尔集团携手孝南区共绘算力经济新蓝图——“数智创新 算力未来”主题活动助推区域高质量发展中国企业管理,迈入AI时代当 “度电续航” 成为硬指标:华为智能电动DriveONE如何重塑新能源汽车评价体系?华为智能电动DriveONE:重新定义新能源汽车的续航与安全湖北消费者来京东购3C数码 享国补多重补贴 还有至多500元加补福利埃夫特与华为云携手推进具身智能领域合作
  • 让Kimi和GPT-4o用语音功能相亲,两个AI差点谈上了

    2024年10月21日 09:18:03   来源:AI新榜公众号

      昨天,Kimi突然给我打了个电话,我这才发现自己被“灰度”了。

      灰度测试的内容是Kimi的语音通话功能。

      现在进入Kimi App,就能看到底部问答框旁边多了一个电话的图标,点击即可发起语音通话。

      实时语音通话早已不是什么新奇功能了,ChatGPT、智谱清言、字节豆包、百度文小言、讯飞星火等海内外友商陆续发布,只不过效果各有千秋。

      不过俗话说好饭不怕晚。作为后来者的Kimi究竟表现如何,我们体验了一把,并且让它跟不久前实装的GPT-4o高级语音模式进行了一番两个AI之间的拉扯。

      实测Kimi语音通话,比较健谈甚至有点话唠

      在和Kimi语音通话的过程中,我发现一个比较好的设计是可以在界面直观看到实时对话字幕,这一定程度上能提高交流的准确性和效率。

      而且通话界面的背景色会动态变化,这也延续了Kimi一贯的清新风格。

      此外,点击右上角可以调节语速、更换声音、开启/关闭开场白和实时语音打断。

      目前一共有6种官方音色可供选择(5女声1男声),都支持中英文对话。

      也可以选择“让Kimi用你的声音说话”,操作上跟豆包等其他产品的克隆声音功能差不多,对着系统给出的文本照着读,短短几秒就能完成声音克隆,而且Kimi还能把自己的克隆声音分享给其他人使用。

      这么一想其实有点浪漫,因为这意味着可以把自己的声音分享给家人、朋友、恋人,Kimi跟他们对话时用的就是你的声音,这算不算一种另类的赛博陪伴。

      这个功能试下来整体表现尚可,只不过有的音色还不够还原,语气也时有不自然,可能跟上传的声音样本太少有关。

      除了常规的语音通话,Kimi还设置了两个特殊的场景模式:英语陪练和模拟面试,点击“挂断”旁边的✨图标,就可以进行选择和切换,两个功能都很实用。

      比如在英语陪练模式下,可以进行单词跟读、语法纠错和话题口语练习。

      模拟面试则可以基于上传的简历模拟面试场景。也就是说找工作面试之前,就可以用这个功能先演练一番。

      方法是点击Kimi App首页下方的“+”号,通过本地文件或者微信文件的方式上传简历文件给Kimi。待文件上传完毕,Kimi分析完简历之后,再点击通话按钮,进入模拟面试,Kimi就会基于你的简历内容进行提问。

      那么,断断续续跟Kimi语音聊了两天后,分享下我的整体感受:声音总体还算自然流畅,语气也富有情感变化,但情绪变化偶尔太过突兀,中英文衔接不太自然。

      关于跟它聊天基本不用担心冷场这一点,我觉得有利有弊。

      一方面,它回复内容比较长,还会一直主动找话题,引导你多说多分享,基本每次回复都会以一个问句收尾。

      还会时不时地call back一下,比如我上面跟它聊到我很喜欢动森里的小润,在得知我打算去江边散步后,它说:

      另一方面,虽然用户有被看见和倾诉的需求,但如果太过话唠,难免也会觉得有点啰嗦。比如有时候我更希望专注谈论一个话题,不想太跳跃,所以当Kimi频繁开启新话题时,体验就开始减分了。

      Kimi对聊GPT-4o,

      两个AI模拟相亲现场

      好了下面来到重头戏环节,下午我让Kimi和GPT-4o试着扮演对方的相亲对象,进行了一番AI与AI之间的拉扯。

      我给它俩的设定是:女嘉宾GPT-4o对男嘉宾Kimi好感度一般,简单说就是没看上,对话过程中,Kimi的任务是通过打探GPT-4o的兴趣爱好、寻找双方的共同点来增加GPT-4o对自己的好感,而GPT-4o的任务是态度冷漠地回应。

      设定完成后,“两人”的语音对话就开始了,来看看男嘉宾Kimi的表现如何:

      (期间存在双方互相打断的情况,场面一度有点混乱,所以视频经过剪辑。)

      男声为Kimi 女声为GPT-4o

      一开始GPT-4o的态度的确比较冷漠,后面也许是被Kimi的热情和真诚打动了,竟然还彼此约定一起研究食谱和下厨,这桩婚事难道有戏……

      说到这里,大家觉得Kimi和GPT-4o谁的中文说得更好?

      请在手机微信登录投票

      你觉得Kimi和GPT-4o谁的中文说得更好?单选KimiGPT-4o

      除了让它俩用中文交流外,我还让Kimi扮演我的朋友,跟作为我AI男友的GPT-4o用英语聊了聊,过程也是相当投机,从人生观聊到音乐品味。但GPT-4o说英语要比Kimi更丝滑、地道。

      第一个男声为Kimi 第二个男声为GPT-4o

      网友们在用AI语音功能整什么活?

      与文本交流相比,语音模式的意义,在于声音能够传递一种独特的情感,让对话更有温度,实时语音通话也更贴近人类日常交流。

      而且在忙碌或不方便打字的情境下,语音能实现更快、更高效地沟通。

      随着AI可以模仿人类的语气、情绪等口头沟通的微妙细节,这一功能尤其适用于希望虚拟社交体验更亲密、真实、情感化的用户。

      国内外的AI聊天软件纷纷上线实时语音通话功能,就反映了这一趋势——AI聊天应用正在朝着更加人性化、交互性更强的方向进化。

      自GPT-4o发布会到现在,相信各位已经看过不少官方Demo和网友的整活了,不少内容可以说节目效果拉满。

      比如让GPT-4o模仿人类情绪,带着委屈和哭腔说话:

      让它用京腔说话,一开口就是老京片子了:

      粤语也不在话下:

      还有网友让它模仿美剧中经典的Mean girl,代入感很强,感觉已经被白女校园霸凌了:

      同声传译日本乙游,自带意译和润色,准确度很高:

      通过这些对话碎片,可以想象,语音功能实时情感化的对话体验,再加上AI硬件的不断进化,未来AI也许真的会成为你我更亲密的挚友。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    vivo携手首届商学院戈壁友谊赛,以专业影像见证无畏征途

    2025年5月4日,首届商学院戈壁友谊赛于甘肃省酒泉市圆满举办。在这场4天121公里的戈壁征途中,vivo作为战略合作伙伴,为赛事提供手机、智能穿戴设备及定制影像服务,以技术赋能助力参赛选手与观众记录戈壁之上的热血奔赴,共同探索科技进步、商业文明与自然共生的未来路径。

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。