淘优惠

淘优惠

谷歌怎么介绍百度的 百度和谷歌结合体

热门文章 0

淘宝搜:【红包到手500】领超级红包,京东搜:【红包到手500】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】

谷歌怎么介绍中国,介绍一下谷歌,谷歌的介绍英文,谷歌用什么

  同一天,谷歌和百度的类ChatGPT项目先后曝光。北京时间2月7日,谷歌CEO桑达尔・皮查伊宣布,谷歌计划推出一款聊天机器人Bard,与OpenAI颇受欢迎的ChatGPT竞争,这一产品的功能与传闻中谷歌正在测试的“Apprentice Bard”聊天机器人十分相似,工程师认为Bard“反应非常像人类,有感知能力”。巧合的是,百度类ChatGPT项目的名字“文心一言”也在同日曝光,产品将在3月完成内部测试。国内外大厂不再藏着掖着,争分夺秒地对外展示自己在AIGC(利用人工智能技术来生成内容)领域的能力,谷歌和百度不是第一批也绝不是最后一批。

  巴德不想当学徒

  “您可以使用Bard计划一个朋友宝宝的送礼会、比较两部奥斯卡提名电影、根据你冰箱里的东西得到午餐的创意。”2月7日皮查伊在社交平台上这样介绍Bard。

  要知道,这个项目在1月底还被叫作“学徒巴德”,就算皮查伊已经官宣,Bard也还没有完全开放,“该软件将提供给一组‘值得信赖的测试者’,然后在未来几周内更广泛地提供给公众”。皮查伊说。

  皮查伊向公众举了很多有关展示巴德功能的例子,“巴德可以成为创意的出口,也是好奇心的发射台,帮助你向9岁的孩子解释NASA的詹姆斯-韦伯太空望远镜的新发现,或者了解更多关于现在足球界最好的前锋,然后得到锻炼技能的机会”。

  皮查伊还指出,巴德“利用网络上的信息,提供新鲜、高质量的回应”。回答有关最近事件的问题,这是ChatGPT正在努力实现的功能。看来谷歌对ChatGPT的火爆不只羡慕,还不服气。

  谷歌对ChatGPT的敏感是有原因的。

  2022年OpenAI推出ChatGPT,数百万人免费使用,很快人们就开始讨论,这种新颖的自动文本生成形式会怎样影响教育、工作,当然还包括谷歌发家业务搜索引擎的未来。就在那一时期,谷歌发布了“红色代码”警告。

  后来的谷歌压力似乎越来越大。有消息称OpenAI的投资方微软正在将ChatGPT整合到必应搜索引擎以及办公软件套件等产品中,甚至坊间已经有了经ChatGPT增强的必应截图。

  “很快,你将在搜索中看到由人工智能驱动的功能,将复杂的信息和多种观点提炼成易于消化的格式,这样你就可以迅速掌握大局,并从网络上学到更多东西:无论是寻求额外的观点,如既弹钢琴又弹吉他的人的博客,还是深入了解相关主题,如作为初学者入门的步骤。这些新的人工智能功能将很快开始在谷歌搜索上推出。”皮查伊的一席话被认为是谷歌的反击。

  文心一言3月完成内测

  大洋彼岸,同是搜索出身的百度也不再遮掩。百度类ChatGPT项目“名字确定为文心一言,英文名ERNIE Bot,3月完成内测,面向公众开放。目前,文心一言正在做上线前的冲刺”。百度相关人士告诉北京商报记者。

  百度明确对ChatGPT表达热情是在这一两个月。但结合2022年9月,百度CEO李彦宏对人工智能发展在“技术层面和商业应用层面,都有方向性改变”的判断,业内人士推测,百度那时候就已开始做文心一言,文心一言的上线时间也有可能提前。

  为什么谷歌和百度对ChatGPT的反应如此强烈?得从ChatGPT是什么说起。

  根据OpenAI官网的介绍,ChatGPT是用于对话的最优化的语言模型,以对话方式进行交互。ChatGPT能够回答后续问题、承认错误、质疑不正确的前提和拒绝不适当的请求。

  通过网友与ChatGPT互动的内容理解更加简单些,ChatGPT可以用特定风格改写歌曲、用热门剧集主角口吻创作剧本对白、基于某教授经历撰写维基百科式的生平条目等。

  用易观智慧院分析师陈一墨的话说,“ChatGPT大火,是因为它对语义的精准‘理解’,实际表现也被大众承认,可以进一步解放生产力”。回头看搜索引擎,也是理解-反馈的过程,虽然现在搜索引擎给出的反馈已经不限于文字、视频、图片,但网友对一些抽象概念具体化、更有创造力的反馈需求正在增长。

  概念股闻风

  “ChatGPT们”的热度越来越高,科技大厂毫不遮掩自己的野心,这让第三方观察者的态度也发生了变化。

  不久前,在一场连麦分享会上,有着十几年行业观察的文渊智库创始人王超,对未来互联网发展有过这样的预测,“我认为移动互联网过后,新一轮科技革命还没有到,AR(增强现实)、区块链、元宇宙、to B、硬件、Web3、NFT(非同质化通证)都没有具有代表性的落地的东西”,整场活动中也没有出现ChatGPT这个字眼。

  这并不代表ChatGPT不重要,但至少在那时那刻ChatGPT并没有进入王超视野。2月7日,他告诉北京商报记者,“预测是随时变化的,AI如果到了奇点,那也不是不可能,现在看有点苗头了”,这个苗头包括形成社会共识,但他强调“最重要的还是技术”。

  资本市场的表现更加直接。2月7日午间,ChatGPT概念股延续涨势,神思电子“20cm”涨停,天娱数科、东港股份等涨停。连板股方面,ChatGPT概念汉王科技7连板,天娱数科5天4板。

  类似的情景一点也不陌生,元宇宙、NFT、区块链大火时,概念股暴涨不只发生在A股,几乎所有的资本市场都有记忆。

  这次不同的是,谷歌和百度亲身入局,且涉及的业务关系到安身立命的基础,与战略方向密切相关,但没人敢说这就是下一个确定的风口。

(责任编辑:谭梦桐)

财鑫闻丨互联网大厂争先涌入,A股相关概念沾边就涨,ChatGPT究竟是何方神圣?

江苏财鑫互联网科技,鑫财蕴理财资讯平台,鑫财通app,鑫火财经骗局
 
 
 

  大众网・海报新闻记者 沈童 报道

  近期,ChatGPT概念在各个领域表现火爆,从撰写论文到调试复杂的计算机代码,其能力令科技界惊叹不已。资本市场更是反应强烈,相关概念板块涨幅已近30%,龙头汉王科技连续7个涨停板,海天瑞声、云从科技等也涨幅居前。值得注意一提的是,百度类似ChatGPT的产品今日正式官宣,该项目名字确定为文心一言,英文名ERNIE Bot,三月份完成内测后面向公众开放。受此影响,百度港股今日大涨15.33%,盘中最高上涨超过18%。那么,ChatGPT概念火爆的背后,是AI行业迎来的一次新的技术变革,还是像此前诸多新概念提出时的热情炒作?作为投资者,又该如何选择投资赛道,精准上车?

(今年以来人工智能板块整体涨幅近30%)

  国际互联网大厂涌入ChatGPT,英伟达今年已涨近45%,A股有公司已7连板

  事实上,ChatGPT并非是在最近提出的一种新技术。资料显示,ChatGPT是一款由OpenAI开发的聊天机器人模型,它能够模拟人类的语言行为,与用户进行自然的交互。

(ChatGPT页面)

  自2022年底,由AI驱动的ChatGPT推出后便风靡全球,ChatGPT上线仅5天,就已经拥有超过100万用户。据悉,截至2023年1月末,ChatGPT的月活用户已突破了1亿,成为史上用户增长速度最快的消费级应用程序。

  随后,这阵风吹到了各大互联网公司,微软宣布旗下产品将全线整合ChatGPT,对于微软而言,ChatGPT对必应(Bing)的赋能有望助其突破谷歌的桎梏,作为回应,谷歌也将发力大型语言模型。国内方面,近日多家知名互联网公司纷纷公布人机对话相关专利。其中,腾讯申请的“人机对话方法、装置、设备及计算机可读存储介质”专利可实现人机顺畅沟通;阿里巴巴达摩院(杭州)科技有限公司申请的“人机对话及预训练语言模型训练方法、系统及电子设备”专利可提升问答交互的准确性;华为技术有限公司申请的“人机对话方法以及对话系统”专利可识别用户异常行为进行回复。

  值得一提的是,百度在2月7日正式宣布将推出类似ChatGPT的产品,该项目名字确定为文心一言,英文名ERNIE Bot,三月份完成内测后面向公众开放。

(百度港股盘中上涨超过18%)

  当然,二级市场从不会错过这些概念。2023年以来,ChatGPT及AIGC(利用AI技术自动生成内容的生产方式)相关概念持续火爆,海外股票市场率先启动,美股英伟达今年以来涨幅近45%,市值重回5000亿美元大关;中概股百度今年以来涨幅已超25%。春节后,A股市场的相关概念股也一路飙升,汉王科技连续7个交易日涨停。海天瑞声、云从科技等也涨幅居前。

  受ChatGPT概念带动,软件与服务板块股票也涨势明显。其中,青云科技-U、海天瑞声、博睿数据、铜牛信息、云从科技-UW、科大国创、润和软件等个股涨停或涨幅超10%,科大讯飞、拓尔思、首都在线、开普云、科蓝软件等个股涨幅居前。

(人工智能概念个股纷纷上扬)

  ChatGPT到底是什么?为何如此受追捧?

  那么,ChatGPT对AI产业来说究竟有何意义,使得其如此受到国际市场的追捧?

  “ChatGPT受到广泛认可的重要原因是引入新技术RLHF,也就是基于人类反馈的强化学习。而RLHF的重点是如何让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致。”洛克资本副总裁史松坡在接受海报新闻记者采访时表示,通过人类不断的使用和效果反馈,能够起到迭代优化AIGC的效果。

  天使投资人、资深人工智能专家郭涛认为:“作为一种非常好的模拟人类聊天行为,ChatGPT在理解能力和交互性方面表现也更强,促进了AIGC行业迎来井喷式发展,为AI行业带来了一种全新的商业形态和商业模式,能够促进AI行业高速协同发展。”

  值得一提的是,作为一种人机交互应用,与此前众多技术不同的是,ChatGPT具有广泛的商业化前景。郭涛告诉海报新闻记者:“这将推动众多行业的快速变革,有望在AIGC、客户服务、医疗健康、教育、家庭陪护等领域快速落地,具有万亿级市场规模。”

  确实如此,AI技术高速迭代,增速惊人。中国电子学会数据显示,2021年中国人工智能核心产业市场规模为1300亿元,同比增长38.9%。据《新一代人工智能发展规划》,到2025年,我国人工智能核心产业规模将超过4000亿元,带动相关产业规模超过5万亿元。

  有机构认为,AIGC将进一步推升算力需求,下游应用场景的拓展与大模型的快速发展也将有力推动行业上游发展,无论是算力还是数据标注的需求都将大幅增加。“ChatGPT在参数规模上已经达到了千亿级别,对于AI大模型而言,不论是训练还是推理,对于算力等基础设施都有着极大的需求。”国泰君安计算机行业首席分析师李牧华说。

  AI产业迈进“复苏期”?“国内玩家”将面临哪些难题?

  事实上,从2020年开始,AI业界常常提起“产业迈进死亡之谷”的论断。那么此次AIGC的兴起,是否可以认为是AI产业迈进“复苏期”的一个征兆?对此,史松坡表示,AI是一项具有长久生命力的技术领域,在这个时期,技术进入了渐进式创新的阶段,人们在该领域所看到的新东西越来越少,很多“理所应当”的产品、应用其实也在不断出现。

  “目前,AI行业处在一个蓄力等待新风口的时期。图像、语音、建模、机器人控制等领域,第一批企业机构已经形成了现有格局,前几年对于创业型AI企业来说是黑暗的年份,因为AI算力、数据等限制,小企业越来越难有露头的机会,新的热点出现,有利于有新的玩家加入,开辟新的赛道。”

  记者注意到,目前国际众多知名大型互联网企业已率先进入该领域,微软、谷歌等企业已经开发出了ChatGPT应用。而相较于国外玩家,国内企业目前大多还处于筹划阶段。那么,现阶段国内企业是否有足够的研发能力打造自己的ChatGPT呢?在发展过程中,企业又将会遇到哪些困难?

  史松坡告诉记者:“ChatGPT的核心技术是RLHF,即基于人类反馈的强化学习。海外ChatGPT的应用中,人工智能自动搜集全球数据信息,也允许用户回答反馈各种信息,但我国对搜集获取海外特定敏感信息以及用户的回复内容是有政策限制的,这就天然限制了国内ChatGPT的完善。所以,OpenAI研发出ChatGPT的原因,并不只是研发能力,也有海外宽松的互联网数据内容的监管环境。”

  海报新闻记者注意到,目前ChatGPT在海外英文环境中已经能胜任图画创作、音乐创作、文字整理、信息搜集综合、基础编程和金融分析,但还不能胜任高频度的人类主观决策,比如大型投资决策、政治战略决策等。因此在本质上,ChatGPT是一个高效的信息整合助手,可以取代大量人类中初级助理的角色。

  那么在中文环境中,ChatGPT表现又将会如何?史松坡认为,由于受到境内外互联网衔接的限制,ChatGPT尚未能升级反馈出类似英文环境中如此高效的效果。

  值得一提的是,百度在2月7日正式宣告进军类ChatGPT应用,相比其他跃跃欲试的国内企业,百度有望成为国内首批应用落地的尝鲜者。

  “作为和谷歌同类型的搜索引擎,如果百度能得到国内监管部门的认可,推出ChatGPT应用,还要解决信息获取的合法性问题――海外ChatGPT的应用中,人工智能自动搜集全球数据信息,但我国对搜集获取海外特定敏感信息是有政策限制的,这点是否会影响中文AIGC的效果,需要验证,这也是应用的最大难度。”史松坡说。

  当然,除了以上担忧外,ChatGPT要实现大规模商用仍面临诸多问题。如不能满足天量并发式的用户互动流量,响应能力不足;目前AIGC只能搜集现有信息,进行综合,无法自行创造。此外,对AIGC的滥用也是当前各领域最为担忧的问题之一,如学生用AIGC来完成论文,员工用来批量制造工作报告等等。

  哪些细分领域将有投资机会?何时进场最为合适?

  最后,将视线重新拉回到资本市场。对于眼下ChatGPT热潮带来的投资机遇,西部证券计算机行业首席分析师邢开允认为,2023年有望成为AIGC发展大年,ChatGPT将为计算机基础设施、算力等上游技术、代码机器人等下游带来需求。目前,OpenAI等巨头已着手自建计算集群来满足AIGC的要求,国盛证券计算机行业首席分析师刘高畅表示,集中式的模式对GPU、存储、机房、供电等基础设施均有巨大需求。

  华西证券计算机行业首席分析师刘泽晶表示,AIGC前景广阔,受益厂商可分为三类:一是AI处理器厂商,具备自研AI处理器的厂商可以为AIGC的神经网络提供算力支撑,AI处理器芯片可以支持深度神经网络的学习和加速计算,相比于GPU和CPU拥有成倍的性能提升和极低的耗电水平;二是AI商业算法商业落地的厂商,原因是AI算法的龙头厂商在自然语言处理、机器视觉、数据标注方面都具有先发优势和技术领先性;三是AIGC相关技术储备的应用厂商,相关厂商有望在降本增效的同时实现创意激发、提升内容多样性并打开海量市场。

  但从投资的角度分析,国信证券山东分公司类兴亮认为:“目前市场处在主题产生的阶段,离业绩兑现还很远,好处是不必受到业绩与基本面的束缚,但是相应的也有较大风险,因此还是应该本着传媒互联网板块超跌反弹的思路来应对。”


科大讯飞谈人工智能 科大讯飞ai赋能让一切皆有可能

科大讯飞采访,你认识科大讯飞吗,科大讯飞的创始人,科大讯飞一听说

来源:雪球App,作者: wen70,(https://xueqiu.com/7438050998/237205395)

最近一个叫做ChatGPT的模型火爆了科技圈。Chat的意思是“聊天”,GPT是一个AI模型系列,顾名思义它是一个用于构建聊天机器人应用的AI模型。聊天机器人大家可能都见过甚至使用过,像是智能音箱,或者是微软小冰。在过去,它们一般被戏称为“人工智障”,因为在我们人类看来,它们还不具备我们所期望的智能程度。而这一次ChatGPT能火爆,则是因为它大大地超出了包括我自己在内的很多人的预期。下方图片演示了ChatGPT的效果,图片来源于浙大投资交流群群友,侵权删除。

在ChatGPT火爆之前,今年其实很早就有在吹AIGC(人工智能生成内容)的风。更具体地来说,今年出现了多个效果相当不错的用于作画的AI模型(如Dall・E 2)。给这些模型输入一句话或者几个关键词,它们就能给你生成像模像样的图片(见下图;图片来源于The Information网站文章“Can Creatives Survive the Future War Against Dall-e 2?”)。有的模型还允许你选择特定的风格或者喜欢的艺术家,从而根据你的喜好去进行作画。

在最早接触到这些作画模型的时候我也好好体验了一把。总的来说挺有意思的,但问题也很大。有意思的地方在于,它们生成的画作虽然存在肉眼可见的问题,但总体上还是像模像样,没有受过专业训练的人肯定达不到这种水平。如果要应用的到正式的场景,可以把它们生成画的当成是初稿,然后搭配上一些方便用户进行编辑(或者说PS)的交互功能,我感觉这是能产生实际价值的。而这其中也存在很大的问题。懂机器学习的都知道,模型是从数据样本中学习出来的。这些作画模型都是从已经存在的图片数据集中学习出来的,如果能说明它们是在创作,而不是在抄袭后进行调整又或者是东拼西凑呢?

我本人不是搞计算机视觉或图像处理的,对于这个方向也不感兴趣,因此只是粗略地看了一下相关论文,理解了一下其中的思想。简单来讲,这些工作普遍使用了一类叫做Diffusion Model的模型。为了方便大家理解,以电视信号作为类比。当电视信号良好的时候,我们可以看到很清晰的画面;当电视信号不好,也就是说信号里夹杂了很多噪声的时候,电视画面看上去就像是一堆杂乱无章的像素图案。而Diffusion Model就是想训练一个能从噪声(杂乱无章的图像)中恢复出原图像(清晰的图像)的模型。抛开复杂的底层技术原理,简单来讲,它的思想就是先给正常的图像加噪声,然后再想办法训练出一个能去噪声还原真实图像的模型(见下图;图片来源于论文Denoising Diffusion Probabilistic Models)。

咋听之下Diffusion Model应该是用来进行信号去噪和图像修复的(事实上确实也是),那它们为什么能用来生成图片呢?这里也不讲什么Encoding、Decoding、Embedding这些大家听不懂的英文术语。个人理解,这些模型具有将模糊抽象的表征(噪声图像)映射成清晰具体的表征(清晰图像)的能力。所谓模糊和清晰以及抽象和具体都是以信息量而界定的。比如我们说“一条狗”,这就是一种模糊抽象的表征,信息量很少,但如果直接给出一张狗的照片,那就很清楚具体了,甚至可以根据照片去找到对应的狗。而这种能力正是这些AI作画或者说图片生成的工作。

回到之前说的问题。我对于这些AI作画模型的担忧主要在于抄袭这类的涉及版权的问题。那么,这些生成出来的图片到底会不会有这类问题呢?在前两年的时候其实就已经有一些相关的模型,可以做图片的合成,比如把两个人的照片合成在一起,可以同时具有两个人的特征。现在生成出来的图片,其实也是对多张图片的特征加以不同的参数权重(加权),最后混合在一起(见下图;图片来源于论文Denoising Diffusion Probabilistic Models)。

以一个简单的例子来解释加权:一对夫妻想借由模型看看子女未来的模样,假设这个孩子未来一半像爸爸一半像妈妈,那么就可以对丈夫和妻子的照片分别加以0.5的权重,将各自的特征混合在一起生成照片;假设这个孩子未来更像妈妈一点,那也可以分别设置0.3和0.7的权重,这样生成出来的照片就会具有更多妻子的特征。当然,这里只是举个例子,由人类遗传基因组合产生的相貌特征和由模型生成出来的肯定还是不一样的,但是模型对于原始图片进行特征混合的能力还是值得肯定的。换一种角度来说,根据个人的理解,这些模型就是对于多张已有的图片进行了特征混合,产生出来的图片可以看成是一种具有多重特征的“缝合怪”。我不是学法律的也不懂相关的伦理问题,无法界定这算不算抄袭,但就个人来讲,至少我很难把AI作画称之为“创作”。

在回顾完之前的AIGC热点AI作画模型之后,为了方便大家对于AI以及机器学习有个系统的认识,这里先区别一下ChatGPT所代表的自然语言处理(Natural Language Processing,NLP)模型和之前所提的处理图像所用到的计算机视觉(Computer Vision,CV)模型。NLP和CV是AI中的两大分支,分别用于处理文本和图像这两种不同模态(Modality)的信息,为了方便大家阅读以下简称语言模型和视觉模型。文本和图像是不同模态的,一个最显著的区别在于文本是串行处理的,而图像是并行处理的。什么意思呢?我们阅读和说话都是一个字接一个字,一个词接一个词,词与词之间的顺序是有意义的,把词和词交换一下位置或者把句子颠倒一下顺序,会对于语义有着显著的影响。或者说,文本的序列效应是非常显著的。而图像则不然,我们在看图像的时候往往都是以整体的方式,同时地认知某个图案的多个像素。我们不会觉得其中某些像素是先出现而某些像素是后出现的,在其中像素的顺序往往没有意义,有意义的是其空间排布特征,或者说像素之间的位置关系。由于信息模态的不同,语言模型和视觉模型之间是相互区别的。当然,在模型层面,它们也存在相互借鉴共通的地方,并且存在跨模态的模型(比如之前所说的AI作画就是从文本跨到了图像)以及迁移学习,这里避免太绕我们暂时把这些放在一边。

跟大家解释了这么半天,其实就是想说明一个问题:术业有专攻。虽然一些大的研究机构和科技公司可以同时在这两方面发力(比如ChatGPT和Dall・E 2都属于得到微软投资的OpenAI),但一般公司很难做到这一点的。这其中有业务方面的原因,因为语言模型相关的业务(机器翻译、语音交互、智能客服)和视觉模型相关的业务(人脸识别、目标检测、自动驾驶)的差别还是挺大的,如果不是大型综合服务类的公司可能不会有那么广泛。另外一个原因就是投入了。首先需要投入人力成本,AI专家和算法工程师的收入都不菲,往往比一般的研发人员要贵。其次存在服务器的成本。不管是自建服务器还是租用云服务,AI的模型训练对于算力的需求都是一笔不小的开销,特别是在流行大模型的当下。最后,也是个人认为最底层的一个问题,训练模型都需要数据集,构建数据集本身就是一件非常居然挑战的工作。许多AI领域的成功都依赖于长年累月的积累,虽然模型可以参考学习最前沿的论文,但很多的商业数据集都是不公开的,需要花高昂的代价获取,甚至是要从头开始针对特定业务构建。在AI领域中业务数据本身就构成强大的护城河,对于初创公司或者在一个领域中已经做得很成功的公司,想要在另一个领域中获得成功可不是一朝一夕的事情。

上面在讲术业有专攻的同时也提到了另外的一个问题:门槛。这一轮的AI的热潮和算力的发展是密不可分的。越是具有潜力的模型,其参数空间(模型规模)也就越大,其需要的训练数据集往往也越庞大,训练和调试的成本也就越高。即使不考虑人力的差别,光是算力和数据集这两项,就决定了小公司很难跟大公司竞争,新入局者很难跟资深玩家竞争。同时,和早几年疯狂烧钱的环境不同,现在普遍处于一种收紧的状态,哪怕是一些大公司也不愿意在不确定性的赛道上浪费时间和金钱,AI领域的玩家也不会像以前那么多了。

在A股的上市公司中,AI领域的头部玩家就两个:海康威视和科大讯飞。海康和讯飞刚好分别对应了视觉和语言这两个主流赛道。很多股友对于海康的印象就是做监控摄像头的,这种看法有一定的局限性。首先,在硬件层面,监控摄像头其实就是一种信息传感器,是物联网中最主流的设备之一,因此海康不仅自带物联网(IoT)属性,而且是最头部的玩家。很多朋友可能不懂这个,下面给一段百度百科对于物联网的解释。这个我最早其实也不懂,直到和一个在涂鸦智能的朋友交流过才明白的。其次,海康的很多业务都跟视频图像处理有关,公司在计算机视觉方面有很多的经验和业务数据积累。这里我不清楚海康在计算视觉领域的总体布局,因此也不想说海康在AIGC这种新兴领域也能有所表现,我想说的是海康至少在人脸识别和目标检测这些传统的视觉业务上有很强的实力,而且具备向智慧城市等AIoT(AI+IoT)发力能力。

相比于海康所在的计算机视觉这个赛道,我其实对于科大讯飞所在的自然语言处理更加熟悉一些。大家对于讯飞早期的认知可能是这是一家做输入法的公司,最近这些年还会加上一些翻译的产品和智慧教育相关的项目。我自己就是科大讯飞的用户,常年使用讯飞输入法,以及讯飞提供的机器翻译接口。讯飞的机器翻译效果挺不错的,感觉强于Google的机翻。以我自己作为对比,我当年英语六级成绩差不多550,常年进行学术论文写作。在不涉及专业术语的场合,我将自己想表达的意思写成中文再用讯飞的机翻,是要略强于我自己直接用英文写作的。因此,我很喜欢在需要外文写作时用来打草稿,或者在一些需要翻译的场景下对其进行二次开发。

然而,翻译只是一个具体的场景,凭借着语言模型,讯飞能切的赛道其实挺多的。一个公开的例子是智慧医疗。关注讯飞的朋友可能还记得云知声IPO时虚构数据的被科大讯飞锤的事情,也就是在那个时候我才知道讯飞不仅切了智慧医疗这个赛道,而且还是第一梯队的玩家。另外一个也是我个人最关注的赛道其实是智慧教育。早在去年的时候,我所在的团队和阿里达摩院的某团队有过一些关于教育知识图谱方面的科研合作初步意向交流。由于种种原因最后没有达成正式的合作,但在这个过程中我也了解了不少行业动态。当时最令我惊讶的是,达摩院的团队跟我们介绍教育知识图谱时明确说了科大讯飞处在领头地位,而他们是追赶者。

知识图谱是一种数据结构,以关系图的形式表征知识。教育知识图谱是指针对教育领域中各个学科的知识图谱。举个简单的例子来说(见下图;图片来源于维基百科),“猫是哺乳动物”这样的一个知识,转换成知识图谱中的<实体,关系,实体>(或<实体,属性,值>)的三元组就变成了<猫,是,哺乳动物>。像这样的<点,边,点>的三元组集合构成了一个大型的图谱(或者说网络),可以表征各种各样的知识。不同的学科领域有不同的知识点,知识点之间相互关联相互承接(比如,我们得先学习元素周期表,知道氢和氧这两周元素,之后才能学习水是由氢和氧两种元素,否则没有意义),有许多甚至是跨学科的,因此错综复杂。为了确保质量,我们往往无法利用模型直接从教材中全自动地去抽取这些知识点然后转化成知识图谱,而是需要依靠人工地去抽取和编辑。这是一件相当庞大且具有挑战的事情。据说讯飞也是找了很多老师使用一些工具去做这些事情,具体的成果我目前还不清楚,能看到的是讯飞在一些语言模型比赛中所取得的成绩和在教育领域中拿到的一些项目。这件事情也改变了我一个认知,即在语言模型这条赛道上,讯飞是有能力跟国内这些科技巨头掰掰手腕乃至是压过一头的。甚至是说,这些巨头在讯飞所擅长的领域也很难撼动讯飞。所以当看到ChatGPT爆火的时候,我脑海中第一只浮现出来的股票就是讯飞。我知道讯飞在这方面的能力很强,不过我不清楚讯飞在这方面具体的布局。

话说回ChatGPT,这次它的表现真的有点相当令人意外。根据朋友给我演示的例子,我真的看到了巨大的潜能。它不仅是一个能回答你问题的聊天机器人,它甚至可以是一个编程工具,或者是一个数据分析工具。下面展示的就是朋友在教ChatGPT一种数据处理语法以及某个操作之后,ChatGPT根据命令把上面的原始表格处理成下面的表格(图中红框和箭头所示)。这个操作是一个数据分析中并不是特别常见的长表转宽表的操作,我相信大多数人在Excel中除了复制单元格之外都不知道该怎么去操作。我们可以看到ChatGPT在基于说明和案例的教导下很好地学会了这个操作,这也是ChatGPT让我惊奇的地方。

我自己是做智能数据分析的,也拥有自然语言处理相关的技能,虽然这只是一个成功的案例(我相信其背后会有很多失败的例子),我很清楚它的技术难度,也很明白这其中蕴含的巨大价值。如果我们能够教育一个模型让它变成一个数据分析工具,人类只需要给他数据然后告诉它做什么,那么未来很多的数据分析工作都能以一种很简单的方式进行。人们不需要再去学习Excel、Tableau这类的工具,也不需要去学习Python、R这类的编程语言,而只需要用人话告诉它要做什么它就能数据分析任务,这将会对数据分析这个行业带来多么巨大的冲击。而且,跟AI作画这种文娱导向的应用不同,AI编程和数据分析被各行各业所需要,因此这也是更具普世价值的生产力。总之,光是想到ChatGPT能力以及未来的潜能,我感受到了相比之前更加巨大的震撼。

简单梳理一下。ChatGPT火爆了科技圈,而在之前还有AI作画的风潮。AI作画挺有意思的,但也存在抄袭和拼凑的嫌疑(从其底层原理看感觉像是在对图像的特征进行混合),至少我个人不愿称之为“创作”。AI领域中也存在不同的方向,术业有专攻,有两个重要的分支分别是计算机视觉和自然语言处理,相对应的模型分别用来处理图像/视频和文本/语言。AI公司门槛并不低,优质的数据积累足以构成护城河。在A股的上市公司中,与这两个分支相对应的头部玩家分别是海康威视和科大讯飞。海康威视可以往AIoT(AI+物联网)发力,而科大讯飞则在语言模型这条赛道拥有广阔前景。我个人非常看好讯飞的教育知识图谱和其在教育行业的未来,但不清楚有没有类似于ChatGPT的布局。ChatGPT在编程和数据分析等实际应用场景所具有的潜能令人震撼。

最后澄清几点。本人目前持有约1/3仓位的讯飞,以上只陈述个人买入理由,但无意吹票,同时不构成投资建议。本文许多的内容均为个人观点而并不严谨,请勿当成科学事实。图片来自于网络或朋友,均已指明找到出处,如有侵权立刻删除。ChatGPT相关内容均为挑选过的成功案例,意在说明ChatGPT的能做到的事情以及潜在能力,并非证明其现在已经能够替代人类完成相关任务,请勿误解文中案例而夸大其真实性能。

$科大讯飞(SZ002230)$ $海康威视(SZ002415)$ $浪潮信息(SZ000977)$