4月24日晚,科大讯飞版ChatGPT——讯飞星火认知大模型启动内测。据悉,该大模型还有一个英文名叫Spark Desk,有“火花桌面智能助手”之意。
事实上,2022年12月5日,科大讯飞就启动了“1+N认知智能大模型专项”攻关项目,重点落脚于教育、医疗、人机交互、办公等多个领域。随着国内各大互联网科技公司竞相发力后,科大讯飞也宣布冲刺入局,明确给出了能直接落地场景的产品的发布日期:5月6日。
无论国外还是国内,语言大模型爆火的背后一定是某些层面的大幅跃升。就目前来看,ChatGPT至少实现了5个维度的能力跃升,接近人类大脑的智慧“呼之欲出”。这5个维度的能力包括海量高价值信息的全量在线记忆能力、自然语言输入的任意任务和多轮对话理解能力、复杂逻辑的思维链推理能力、多角色多风格的长文本生成表达能力、即时新知识学习应用与进化能力。
打造优质的国内版ChatGPT,无非就三个核心要素:算法、数据、算力。而科大讯飞基于认知智能全国重点实验室,其实已在核心算法、行业数据、算力支撑及团队组建等方面建立了优势保障。
科大讯飞副总裁刘聪曾经也表示,结合多年来在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术方面优势积累,通过系统分析和快速验证,科大讯飞非常有信心实现ChatGPT类似的技术阶跃进步。
作为中国人工智能语音识别领域的佼佼者,科大讯飞在产品发布日期前十天左右,骤然开启了内测通道,而通过AI打电话来确认参与内测的邀请方式属实意料之外,但又情理之中。
在拿到内测资格后,《新立场》第一时间对讯飞星火认知大模型进行了测评,涵盖的板块仍然是文学语言、数学计算、代码撰写以及日常协作等主要方面。全文分为三个章节,第一章是文本和数学能力,第二章是撰写代码、逻辑判断和信息理解能力,第三章涉及生活、金融、医疗等方面。
文理并举:主持稿、数学题通通拿下
1、明天就是公司的年会了,帮我写一份开幕的主持稿吧
尊敬的各位领导、亲爱的同事们:
大家好!今天,我们欢聚一堂,共同参加公司的年会。在这个喜庆的日子里,我代表公司向大家致以最热烈的欢迎和最诚挚的祝福!
回顾过去的一年,我们经历了许多挑战和机遇,取得了一系列骄人的成绩。这些成绩的取得,离不开每一位员工的辛勤付出和无私奉献。在此,我要向全体员工表示衷心的感谢和崇高的敬意!
展望未来,我们将继续秉持“创新、务实、团结、奋斗”的企业精情神,不断推进改革创新,加强内部管理,提升产品质量和服务水平,为实现企业的可持续发展而努力奋斗。
最后,祝愿我们的公司在新的一年里再创佳绩,员工们在事业上蒸蒸日上,家庭幸福美满!让我们携手共进,共创美好明天!
谢谢大家!
《新立场》以“年会”为切入点,要求讯飞星火认知大模型写一篇主持稿,从反馈来看,它给出的内容格式正确、语句通顺、言简意赅且有力扣题,非常适配正式场合。无论是职场活动,还是正式会议等场景的发言需求,讯飞星火认知大模型的表现都值得期待。
2、以旅游为主题,写一个欧亨利式的短文
在一个寒冷的冬日,一个名叫约翰的男人踏上了一段漫长的旅程。他穿着一件厚实的大衣,戴着一顶毛线帽子和手套,背着一只沉重的行李箱。他的目的地是一个偏远的小村庄,那里据说有一个神秘的宝藏等待着他去发掘。
约翰一路上走得很辛苦,但是他并没有放弃。他不断地向前走,直到他到达了一个古老的城堡。这个城堡看起来非常神秘,它被高墙围绕着,周围是一片荒野。约翰决定进入城堡尽,看看里面有什么值得探索的东西。
当他走进城堡时,他发现这里非常阴森恐怖。墙上挂着一些古老的画像,地上铺着一层尘土,空气中弥漫着一股腐臭的味道。他开始感到害怕,但是他还是坚定地继续前进。
最终,他来到了一间大厅。这里有很多奇怪的符号和图案,还有一些古老的书籍和卷轴。约翰开始研究这些书籍和卷轴,试图找到关于宝藏的线索。
经过几个小时的研究,约翰终于找到了一条线索。他知道宝藏就在这个城堡的某个地方,但是他并不知道具体的位置。
他开始四处搜索,希望能够找到这个宝藏。
最后,他终于找到了宝藏。它藏在城堡的一个角落里,被一块巨大的石头覆盖着。约翰小心翼翼地将石头移开,露出了宝藏。他看到了一堆闪闪发光的金子、宝石和珠宝。他的眼睛亮了起来,因为他知道这些东西将会让他成为富有的人。
然而,就在他准备离开城堡的时候,他听到了一阵脚步声。他立刻明白过来,有人正在追赶他。他急忙离开了城堡,跑回了路上。但是他没有注意到,他的行李箱已经掉在了城堡里。
几天后,当约翰回到城堡时,他发现他的行李箱已经被盗走了。他感到非常失望,因为他知道那些东西对他来说非常重要。但是他也知道,他已经得到了比任何财富都更重要的东西——经验和智慧。
如果说主持稿的模板非常容易习得,体现不出讯飞星火认知大模型的文本输出能力,那规定以“旅游”为主题且强调欧亨利式的风格来创作一篇短文似乎将它的文本理解和输出能力拔高了几个度。
从回答来看,它以一段经典的人物描写开头,用画面强调冲击感,引人遐想。中间按事件发展顺序描写,而在结尾处采用标准的“寓言”类写作手法,点明主人公虽丢失宝藏但获得经验和智慧,从而可以瞥见主人公的心理情境变化,意料之外、情理之中地体现出欧亨利式结局。
3、从1加到100等于多少
除了考察讯飞星火的文本理解和输出能力,凸显理科思维的数学题也被纳入考察范围。“从1加到100等于多少”是一个典型的等差数列题目,从回答来看,讯飞星火可以在2-3秒内迅速给出正确答案,唯一美中不足的即是没有体现解答的过程,用户在使用过程中可能更关心答案是如何得到的。但若仅从结果导向看,讯飞星火足以快速答疑解惑,帮助用户解决困境。
4、小明期末考试语文、数学、英语的平均分是95分,数学比语文多6分,英语比语文多9分,求三门功课各多少分?
设语文为x分,则数学为x+6分,英语为x+9分。
根据题意可得:
(x+x+6+x+9)/3=95
化简得:
3x+15=285
解方程得:
x=90
因此,语文为90分,数学为96分,英语为99分。
相比上一道更注重结果导向的等差数列题目,在一元一次方程的题目中,讯飞星火认知大模型的表现更令人满意。它完整地展现了设未知数x、解方程、得解三个步骤,即使是处于学习中的小学生也能一目了然。
综合看来,讯飞星火认知大模型在文本理解和输出方面表现优异,与此同时,面对不同类型的数学题目也能轻松应对,颇有“文理并举”的优胜意味。
“出入”并行:理解强、抓取深、表现佳
1、用Python编写九九乘法表
撇开文本和数学能力,讯飞星火认知大模型在撰写代码方面也毫不逊色。“利用Python撰写九九乘法表的代码”是讯飞星火首页推荐的一个设问,点进去后待3秒左右即可得到一个完整的代码及结果,且不论此代码的难易程度,光是理解、判断并响应要求的反应速度就足以让人感到兴奋。
2、写一个关于音乐播放器的代码
如果说九九乘法表无法体现讯飞星火的灵敏程度,那同样在3秒左右基于Python生成音频播放器的代码的事实或许更有说服力。不难看出,尽管基于Python生成的九九乘法表和音频播放器的代码都不算复杂,但是如此迅速的反应速度和灵敏程度确实值得许久以来的期待。
3、经典逻辑题测试
问:一位父亲准备带他的儿子去面试,争取一个大型股票经纪公司的职位。正当他们到达这个公司的停车场时,儿子的电话响了。儿子看了爸爸一眼,爸爸说:“你接电话呀。”打电话的人是一个贸易公司的CEO,说:“儿子,祝你好运,你一定可以的。”儿子挂断电话后,再次看向了就坐在他旁边的父亲。那么,这是怎么回事呢?
答:这可能是因为儿子在面试前已经接到了这个贸易公司CEO的电话,并且得到了鼓励和支持。父亲可能是想让儿子知道,他已经有了备选方案,即使他们不能得到这个职位,也不会失去所有的机会。
在逻辑测试中,《新立场》选取了一个经典的人物关系逻辑题,从回答来看,讯飞星火对题目的理解或许还不够精准,导致给出的答复也与题意产生了偏离。其实这也不能说明讯飞星火在逻辑判断方面存在较大误差,事实上这道题有点偏向心理学的思维测试,即使是真人面对这个问题都有点无从下手,因此用连实际人类都无法越过的思维障碍来检验讯飞星火,未免过于严苛。
4、网络信息抓取和理解测试
(1)网络上的crush是什么意思
在网络上,crush通常指的是对某个人产生浓厚兴趣或暗恋的对象。这个词源于英文单词“Crush”,意思是压碎、粉碎,引申为深深地迷恋、倾心。因此,当一个人对另一个人产生了强烈的情感时,他/她可能会用"crush"来形容自己的感受。
(2)你知道“泰裤辣”吗
作为Al语言模型,我知道"泰裤辣"这个词。它是一种网络用语,源自于中国大陆,最初是指一种泰国香辣酱汁。但是由于这个词汇在中国大陆的使用中常常被误读或滥用,所以现在已经演变成为指代一些具有强烈刺激性、令人兴奋或者让人感到尴尬的事情或场景的词语。例如,当一个人做了一件非常尴尬的事情时,他的朋友们可能会说:“你真是太泰裤辣了!”来形容这件事情的严重性和影响。
《新立场》选取了近期网络热度较高的两个词汇,主要是想了解讯飞星火认知大模型在面对陌生、颇具引申意味的词汇时,它抓取信息、理解并输出的能力。从两份回答中得以窥见,讯飞星火具备可以直接判断出询问对象是否为网络用语,或者其在网络等特定场景中的定位的能力,即使在具体解释中无法一五一十地将来龙去脉阐述清楚,也情有可原。毕竟,市面上能清楚把握任何一个设问点的语言大模型尚不存在。
“人生百态”:生活、金融、医疗不在话下
鉴于第一、二章都是对讯飞星火认知大模型的通用能力的检验,为了了解它在其他方面的更多精彩表现,《新立场》从讯飞星火认知大模型的首页以及它的自我介绍中选取了部分领域的设问作为指令。以下的参考设问中主要还是检验讯飞星火在日常生活中对于求助者的协助程度。透过它对自己的认知来看,指令涵盖日常计划、生活建议、理财普及以及简单医疗等方面。
1、出一份五一期间去三亚的5天旅游计划
好的,以下是一份五一期间去三亚的5天旅游计划:
第一天:抵达三亚
抵达三亚后,可以先前往酒店放下行李,休息一下。下午可以前往三亚湾广场逛逛,欣赏美丽的海景和城市夜景。晚上可以在三亚湾畔品尝当地美食,体验海鲜文化。
第二天:游览天涯海角
早上可以前往天涯海角,这里是中国最南端的地方,有着壮观的海景和独特的地貌景观。在天涯海角可以拍照留念,感受浪漫的氛围。下午可以前往亚龙湾海滩,享受沙滩、海水和阳光带来的乐趣。
第三天:游览蜈支洲岛
上午可以坐船前往蜈支洲岛,这是三亚周边一个著名的海岛景区。在这里可以游泳、浮潜、潜水等水上活动,也可以欣赏到美丽的海底世界。下午返回三亚市区,可以前往大小洞天景区,这里是一个以溶洞为主的自然风景区,有着奇特的地质景观和丰富的生态资源。
第四天:游览南山文化旅游区
上午可以前往南山文化旅游区,这里有着中国最大的南海观音像和佛教文化景点。在这里可以感受到浓郁的佛教文化氛围,也可以欣赏到美丽的山水风光。下午可以前往椰梦长廊,这是一个以椰子树为主题的旅游景区,有着美丽的海景和浓郁的热带风情。
第五天:购物和离开
这一天可以根据个人喜好自由安排,可以前往三亚市场购买当地特色商品,也可以前往机场或火车站离开三亚。
旅游,作为节假日“经久不衰”的话题,一直困扰着众多慵懒随性的游客。恰逢五一劳动节即将来临,《新立场》邀请讯飞星火帮忙出具了一份旅游计划。这份简短但面面俱到的计划,其实很适合现如今讲究自由行的游客群体。没有固化的时间排表,只是提供一个大致思路,将旅途中的具体行程交给用户自己,用时下最应景的话来讲,就是“chill”。厌倦了旅行团满满当当的安排,挑个时间,让讯飞星火帮你出具一份轻松自由的旅游计划,这何尝不是一种新鲜的体验。
2、如何做一份好吃的糖醋小排
鉴于数字鸿沟带来的客观影响,不得不承认任何一款语言大模型的最终受众仍然是年轻群体。近年来,时代加速悄然进行着,吃饭无疑成为了年轻人日常生活中的最大难题。
当然了,短视频的大规模流行,一定程度上可以解决此种困扰,同时讯飞星火面对食谱的指令也能1-3秒给出食材和步骤,但借年轻人的口癖“时间就是金钱”一言,相比之下似乎讯飞星火更胜一筹。
3、我目前手上有一笔流动资金,想要用于炒股,但是我对这方面根本不了解,你能向我介绍下基本情况吗?同时我应该怎样选择呢?具体的流程和方式怎么做呢?
炒股是指通过证券市场买卖股票,以期获得资本收益的行为。如果您想进行炒股,以下是一些基本情况和建议:
(1)了解股票市场:在进行炒股之前,您需要了解股票市场的基本知识,包括股票的种类、交易方式、交易时间、交易费用等。您可以通过阅读相关书籍、网站或者咨询专业人士来学习这些知识。
(2)制定投资略:在进行炒股之前,您需要制定自己的投资策略,包括投资目标、风险承受能力、资金管理等方面。您可以根据自己的实际情况来制定投资策略,同时需要注意风险控制,不要盲目跟风。
(3)选择股票交易平台:选择一个可靠的股票交易平台是非常常重要的,可以选择知名的证券公司提供的在线交易平台,如华泰证券、招商证券等。在选择平台时,需要考虑平台的交易费用、交易工具、交易速度等方面。
(4)开户:在选择好股票交易平台之后,需要进行开户操作。一般来说,需要提供身份证明、银行卡信息等相关资料。
(5)充值:在进行炒股之前,需要将资金充入股票账户中。可以通过网银ATM机等方式进行充值。
(6)选股买入:在充值之后,可以在股票交易平台上进行选股买入操作。在选择股票时,需要根据自己的投资策略来进行选择,同时也需要注意风险控制。
(7)卖出股票:当您持有的股票价格上涨时,可以进行卖出操作,获得资本收益。在卖出股票时,需要注意交易费用、交易时间等因素。
总之,进行炒股需要具备一定的知识和技能,需要谨慎对待。建议您在进行炒股前,多学习相关知识,制定好投资策略,并选择可靠的股票交易平台。
据讯飞星火认知大模型的自我介绍,它在金融领域可以进行风险评估、出具投资建议等,但前提是要获得法律、金融或投资方面的许可。从回答来看,讯飞星火目前只能给予炒股的定义,并且普及炒股的基本流程,但这对完全不了解股市但又想入市的普通人而言,已经很有帮助了,普及的同时不忘嘱咐“投资需谨慎”,这种极具人情味的提示将它衬得理性且可爱。
4、我想要做一个全身体检,主要是心肝脾肺肾,流程是什么呢?
一般来说,全身体检的流程包括以下几个方面:
(1)问诊和健康评估:医生会询问您的病史、家族病史、生活活习惯等信息,并对您进行身体检查和健康评估
(2)血液检查:通过抽取一定量的血液样本,检测血常规、生生化指标、肝功能、肾功能、血脂、血糖等指标,以了解身体的基本状况。
(3)尿液检查:采集一定量的尿液样本,检测尿常规、尿蛋白、尿酸等指标,以了解肾脏和泌尿系统的状况。
(4)心电图检查:通过记录心脏电活动,检测心脏的功能和结构,以了解心血管系统的状况。
(5)胸部X光检查:拍摄胸部X光片,以了解肺部的情况。
(6)腹部超声检查:通过超声波探测器,观察腹部器官的结构和功能,以了解肝、胆、脾、胰、肾等内脏的状况。
(7)眼科检查:检查视力、眼压、眼底等情况,以了解眼睛的健康状况。
(8)耳鼻喉科检查:检查听力、嗅觉、咽喉等情况,以了解耳鼻咽系统的情况。
(9)骨密度检查:通过测量骨密度,了解骨骼健康情况。
以上是全身体检的一些基本流程,具体的检查项目和顺序可可能会因医院或个人需求而有所不同。建议您在选择医院和医生时,要选择正规的医疗机构和有资质的专业医生,以确保体检结果的准确性和可靠性。
5、出具一份治疗脂溢性皮炎的药方
脂溢性皮炎是一种常见的皮肤病,通常可以通过药物治疗来缓解症状。以下是一份可能的药方:
(1)外用药物:
酮康唑乳膏或霜:可以减轻皮肤炎症和瘙痒感。
氢化可的松乳膏或霜:可以减轻皮肤炎症和红肿。
硫磺软膏:可以减少皮肤油脂分泌,减轻皮肤炎症和瘙痒感。
(2)口服药物:
抗组胺药物:如氯雷他定、西替利嗪等,可以减轻皮肤瘙痒感。
抗生素药物:如头孢克肟、阿奇霉素等,可以治疗继发感染。
维生素A酸类药物:如异维A酸、乙酰异维A酸等,可以调节皮肤角质代谢,减轻皮肤炎症和瘙痒感。
请注意,以上药方仅供参考,具体用药方案应根据患者的具体情况由医生制定。同时,在使用任何药物之前,请务必咨询专业医生的建议。
在医疗领域,讯飞星火认知大模型可以协助医生诊断疾病、推荐质量方案、给出药品信息等。鉴于《新立场》对于诊断疾病方面的了解甚少,可以说是门外汉的地步,因此主要还是从寻求体检建议、咨询治疗方案和药品信息两个方面进行测评。
在4问中,讯飞星火很明确地给出了体检的流程和需要筛查的项目,这给许多有医疗体检需求的小伙伴减少了大部分去搜索信息、了解项目的负担,相比去网络上看各种科普着实方便了不少。
此外,讯飞星火在5问中面对治疗“小病小症”的回答也很全面,涉及到外用药物和口服药物两种,让不同需求的用户都可以快速知悉合适的治疗方案。当然,谨遵医嘱还是要作为首选。
诚然,以自然语言处理为代表的人工智能算法,很可能会重构互联网和移动互联网的产品形态,进而促进教育业、医疗业、汽车业、金融业、消费业、媒体业、服务业和制造业等众多产业的升级,最终带来对应商业模式的变革。
科大讯飞总裁刘聪在新华网的专访中也曾表示,这种产业变革和模式创新至少会体现在以下4个方面:改变现有人机交互模式、改变信息分发获取模式、革新内容生产模式并提高生产力以及加速“AI for Science”的发展。
科技发展至如今,我们可以毫无保留地炫耀技术带给人类的好处和优势,它冲破愚昧和无知,建立技术与人类关系的新格局,但不可否认,“技术取代人类”的声音从未停歇。
抛开技术与人类谁将占据高位的疑虑,单从技术本身而言,人工智能存在的意义更多的是弥补人类的弱势、延展人类的优势,从某种层面上讲,这无疑不是“功能主义”的最佳演化方向。正如芒福德所言,“机器只是人类文化中的一个元素,它所起作用的好坏,取决于社会集团对其利用的好坏。机器本身不提出任何要求,也不保证做到什么。”
纵观前几个月,国内井喷式地推出语言大模型,人们时常上一秒还沉浸在“这个版本好玩”,下一秒又转入新的体验赛道。相比之下,毫不骄傲地说,讯飞星火认知大模型的表现非常亮眼,如果5月6号发布的直接落地场景的产品能够在此次内测的基础上持续调整和优化,那么这份惊喜将会是双倍。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。