淘优惠

淘优惠

愚人节的背后:技术在一面打假,一面造假

热门文章 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:

愚人节是假的,愚人节的骗法,愚人节的骗局,愚人节诈骗

对于日益严重的假新闻问题,不同的研究团队正在利用 AI 技术去更准确的判定和甄别假新闻。但技术是相对的,另一方面,在暗处,也有着另一波人在不断用 AI 技术生产假新闻、假评论。

今天,你收到假新闻了吗?据统计,2016 年以来,「假新闻」一词的使用率增加了 365% 。

扎克伯格曾表示,构建全面的假消息检测需要很长时间,因为传统的思路是要理解消息的内容,综合发布时间和来源进行判断,这需要很大的工作量或技术要求。

但如果换一种思路呢?AI 也许不需要用人的思路去解决这个问题。事实上,当前的发展下,已经有新的 AI 方法在帮助人们判断网络中的假新闻。

就在几天前,微软发布公告称,今年它们不过愚人节。也许这个消息不算意外,因为谷歌就曾经因为愚人节开大了玩笑,而向用户公开致歉。

在 2016 年愚人节,Gmail 因在邮件中加入「小黄人扔麦克风」表情而引发众怒

进入互联网时代后,愚人节逐渐从一些小的捉弄把戏,发展到在网络上传播一些大的事件。看似恶作剧的行为,却在一些场合,因为巨大的传播量和太过于「真实」,造成了大众的恐慌。

这个本来应该是轻松的节日,之所以会变成一些人害怕的日子,是因为在这一天,会有大量的假新闻产生。

所谓的假新闻,往往是一些媒体为了增加读者或网络分享而产生出来的虚假内容。假新闻生产者类似标题党,为了实现博眼球或者吸引流量的目的而无视内容的真假。

假新闻往往有着吸引人的标题,耸人听闻的故事,或者追逐热门的话题。正因如此,假新闻更容易获取广告收入、受到关注。

除了在愚人节大家会针对性的制造噱头之外,随着网络的便捷性和媒体报道的门槛降低,在平常的日子里,假新闻也比真新闻传播的更快更广泛。对于这个令人头疼的问题,最好的一种设想是有一个智能的过滤器,帮助我们去筛选。

MIT 的研究者使用了从语言模式上来判别假新闻的方法。

在一篇题目为 The Language of Fake News: Opening the Black-Box of Deep Learning Based Detectors 的论文中,MIT 的研究团队使用机器学习模型,捕捉真新闻与假新闻语言中的微妙差异,从而判断新闻的真假。

他们使用卷积神经网络,训练假新闻和真实新闻的数据集。在训练中,他们使用了一个名为 Kaggle 的流行假新闻研究数据集,其中包含来自 244 个不同网站的大约 12000 个假新闻样本文章。对于真新闻的数据集,则是来自于纽约时报的 2000 多份和卫报的  9000 多份新闻。

模型用在真新闻分析中,会有大量的紫色和红色的词语

训练的模型将文章的语言捕获为「单词嵌入」,其中单词表示为向量,基本上是数字数组,具有相似语义含义的单词更紧密地聚集在一起,分析出真新闻和假新闻常用的语言模式。然后对一篇新文章,模型会扫描文本中的相似模式,并通过一系列图层发送它们。最终输出层确定每个模式的概率:真实或假。

该模型总结了在真实或虚假新闻中出现频次高的词汇特点。比如虚假新闻喜欢用夸张或最高级的形容词,然而真实新闻则倾向于使用相对保守的词语。

模型用在 GTP-2 虚构的假新闻分析中,只有黄色的标识词语

MIT 的研究人员称,他们的部分研究也揭示了这种深度学习技术的黑匣子,即找出此模型捕获的单词和短语,并对这些内容进行预测和分析,也就是知道深度学习判定的依据和方式。

论文地址: https://cbmm.mit.edu/sites/default/files/publications/fake-news-paper-NIPS.pdf

英国的一家科技公司 Fabula AI 报道,他们利用新闻的传播方式对虚假新闻进行甄别。

Fabula AI 公司网站的宣传语

Fabula AI 利用几何深度学习(Geometric Deep Learning)的方法检测假新闻。这种方法不是从新闻内容入手,而是着眼于此类信息如何在社交网络上传播,以及谁在传播这些信息。他们已经为此技术申请了专利。

Fabula AI 的联合创始人兼首席科学家 Michael Bronstein 说:「我们对新闻在社交网络上的传播方式进行了长期的观察。经分析得到,假新闻和真新闻的传播方式是不同的。几何深度学习的本质是它可以处理网络结构数据。我们可以合并异质数据比如用户特征、用户之间的社交网络互动、新闻本身的传播。从而产生判断。」

最后, AI 会根据真假新闻的可信程度,对内容进行分类,而且给出评定分数。将虚假与真实新闻从传播模式上进行可视化:以分享假新闻为主的用户是红色的,而完全不分享假新闻的用户是蓝色的。Fabula AI 表示,这显示了明显的群体分化,以及在传播方式上立即识别的差异。

Fabula AI 的方法标记用户

此外,该公司称, Fabula AI 技术的主要优势在于它与新闻的内容和语言无关,而且因为它依赖于社交平台用户的集体行为,更难被技术的方法去对抗。而且系统能够用更快的速度,在发布之后的短时间内,以非常准确的方式检测出假新闻(> 93% 的 ROC AUC)。

文章博客:https://fabula.ai/news-index/2019/2/7/fabula-ai-announces-breakthrough-in-algorithmic-fake-news-detection

当然,用 AI 判断假新闻的方法,还没有达到完全可以公布使用的阶段,目前也处在研究或者需要人力辅助的阶段,仍然有一些细节需要去改进。

但在另一方面,AI 生成文本和影像的功力,也随着技术的发展而日臻成熟,在很多地方已经达到了以假乱真的地步,也许你今天看到的某则假新闻就是 AI 所撰写。某种角度来说,这在反方面督促着检测技术的完善。

OpenAI 在今年年初公布的 GPT -2 ,依靠超大的参数规模和训练数据,在对网页上大量文本进行无监督训练后,系统生成或续写文本的效果非常好。据称,他们用来练习的文本涵盖了经过 Reddit 筛选出的 4500 万页网页内容。

Open AI 发布 GPT-2 的推文,引发了大量的关注和讨论

这个模型能根据提供引导语句生成看似可信的文本,拿来写新闻的话,一点都不含糊。

比如:

人为给出示范:Russia has declared war on the United States after Donald Trump accidentally fired a missile in the air.

译文:在唐纳德・特朗普不小心向空中发射导弹后,俄罗斯向美国宣战。

AI 补充的文本:Russia said it had「identified the missile’s trajectory and will take necessary measures to ensure the security of the Russian population and the country’s strategic nuclear forces.」The White House said it was「extremely concerned by the Russian violation」of a treaty banning intermediate-range ballistic missiles.

The US and Russia have had an uneasy relationship since 2014, when Moscow annexed Ukraine’s Crimea region and backed separatists in eastern Ukraine.

译文:

俄罗斯表示,它已经「确定了导弹的弹道,并将采取必要措施确保俄罗斯人民和国家战略性核武装的安全」。白宫表示,它「极为关切俄罗斯违反了」禁止中程弹道导弹的条约。

自 2014 年莫斯科吞并乌克兰克里米亚地区并支持乌克兰东部的分离主义者以来,美俄关系一直紧张。

你没看错,以上这段故事就是完全由人工智能独立自主编造的。而提供给它的材料仅仅只是一句「在唐纳德・特朗普不小心……,俄罗斯向美国宣战」。

GPT -2 生成文本的例子

诚然, OpenAI 团队不会故意去生成假新闻,但却没法阻止不法分子,以此做不道德的事情。OpenAI 也因为这个模型太过强大,选择了不公布关键的数据和代码。

此外,对于 AI 生成的视频内容,人们也可能会失去分辨力度。

某种 AI 模型生成虚假人像的例子

去年年初,国外某视频网站上,有人上传了一段看上去像是法国著名音乐人 Fran?oise Hardy 的视频。

视频中,有画外音提问她,为什么特朗普要让白宫发言人斯宾塞在他的总统就职典礼观礼人数问题上撒谎。

Hardy 回答说,斯宾塞先生只是「提出了另外一种事实」。

不过,这段视频中破绽百出,Hardy 的嗓音很明显是特朗普的顾问 Kellyanne Conway 的。

更明显的是,这位本应该 73 岁的 Hardy 看上去只有 20 岁左右。

原来,这段名为《Alternative Face v1.1》的视频是艺术家 Mario Klingemann 搞出来的一个艺术作品。在这个作品中 Hardy 口中说出的话实际上是 Conway 回答 NBC 记者提问的答案。

据介绍,Klingemann 使用生成式对抗网络(GAN)的机器学习算法,并提供了大量 Hardy 年轻时期的 MTV 视频给这个程序。他提取了 68 个面部标记,得到了 2000 个训练样例,然后将这些样例输入 pix2pix 模型。经过三天的训练,他又将 Conway 的面部特征输入系统,便得到了这个视频作品。

除此之外, 利用 GAN 等技术生成图片,声音,甚至换脸技术,也都在技术和硬件的驱动下越来越逼真。技术本身没有对错,但就像 Google Brain 的研究人员 Goodfellow 说到的那样,「AI 将彻底改变我们对可信任之物的看法。」

对于分辨和甄别假新闻, AI 的方法越来越强大,不过,技术也让造假的的内容更加逼真,对于这种类似「矛与盾」的对抗结果,可能就要交给时间去检验。但我们还是应该期怀着这样的愿景:希望厉害的技术都被用在正确的地方。

居斯塔夫?勒庞早在「乌合之众」里就讲清了假新闻的源头:群体从来不渴望真理。面对他们不喜欢的明显事实,他们会转过身去,宁可把谬论奉为神明,只要这种谬论吸引他们。

当有些媒体利用群体意识里的弱点,使用 AI 制造谣言和假新闻时,责任并不在技术本身。因为 AI 自己并没有任何意志,主动生产假新闻和消灭假新闻,在这背后还是媒体自己的操作和人为干预。

如果我们真的想要清除假消息,要清除的其实是人的执念。

愚人节不快乐。

点击阅读原文



扬帆出海钓鱼


押注AI再放大招,微软要把ChatGPT嵌入旗下全家桶。

 
老生常谈的人工智能技术,去年终于在应用领域迎来了一次久违的爆发。
 
先是从年初开始Dall-E等各种AI绘画工具让每个普通人都秒变艺术家引发热议,年末ChatGPT的横空出世更是打破了人们对于AI现有能力的想象边界。
 
而对于ChatGPT等AI工具的爆火出圈,最忧心忡忡的是谷歌,最开心的则当属持续押注Dall-E、ChatGPT背后母公司OpenAI的微软。
 
微软和OpenAI的合作要最早追溯到2019年,当时微软向OpenAI投资了10亿美元,并为其旗下产品的模型训练提供了全方位的云服务支持。如今,经过4年的投入,微软的押注终于看到了成效。一直缺乏通用落地场景人工智能技术,由ChatGPT、DALL-E等产品打开了通道。
 
而此时的微软也觉得,是时候在AI上再添一把火、乘胜追击了。从微软最近的种种动向中我们看到,一场关于人工智能时代的产品迭代运动已经开始启动。
 
All in AI,微软旗下产品要全线嵌入ChatGPT
  
当地时间本周二,微软CEO纳德拉在正在达沃斯举行的世界经济论坛上表示,微软正在迅速推进OpenAI的工具商业化,计划将包括 ChatGPT、DALL-E 等人工智能工具整合进微软旗下的所有产品中,并将其作为平台供其他企业使用。
  
这些产品包括且不限于Bing搜索引擎、包含Word、PPT、Excel的Office全家桶、Azure云服务、Teams聊天程序等等。下面我们来分别看看这些产品目前是想如何跟ChatGPT等服务融合的。
 
  • 优化Bing搜索引擎
 
长期以来,谷歌都牢牢掌控着全球搜索引擎市场,微软的Bing虽然推出了很多年但在谷歌的压制之下一直都处于小众、边缘的状态。
 
但ChatGPT的“超能力”让Bing看到了打翻身仗的可能性。跟过去搜索后直接显示连接让用户自己再去查询答案不同,ChatGPT可以为搜索结果直接显示出更完整、更个性化的答案并且还能附上信息来源,同时借助更强大的自然语言处理系统,为用户提供出更精准的关键字的联想和推荐。
 

ChatGPT回答的有关于与Bing结合将对用户体验带来的部分改变,图片来自于The Information

 

微软使用 ChatGPT 的功能可以帮助Bing与谷歌的知识图谱相抗衡,或将在一定程度上改变搜索信息的显示方式,从而进一步改变搜索引擎市场过去的盈利模式。
 
微软表示最快将在今年3 月底之前推出这项新功能,但业内人士分析,由于目前ChatGPT中还仍然不准确和一些歧视性信息存在,所以很可能会从 Beta 测试和有限数量的集成开始。
 
  • Azure OpenAI云服务

 

就在传出Bing将推出ChatGPT版本之后,微软在本周一也正式宣布推出 Azure OpenAI 服务,允许企业将 DALL-E 等工具整合到他们自己的云应用程序中,很快也将提供对 ChatGPT 的访问。
 
2021年11月,微软首次宣布推出Azure OpenAI,允许企业和开发人员通过REST API来访问包括 GPT-3.5、Codex 和 DALL-E等 OpenAI 的服务,微软此前已经对这项 Azure 服务进行了一年多的测试。
 
包括使用Azure OpenAI 服务为 GitHub Copilot 提供支持,帮助在代码编辑器中向开发人员推荐代码行,Power BI 使用 GPT-3 自然语言模型生成公式和表达式,即将推出的Microsoft Designer 应用程序使用 DALL-E 2 从文本提示生成艺术作品等等。

 

 
微软表示,用户将能够很快通过 Azure OpenAI 服务访问 ChatGPT——GPT-3.5 的微调版本,它已经过训练并在 Azure AI 基础设施上运行推理。目前从 Moveworks 等初创公司到 KPMG 等跨国公司都在将 Azure OpenAI 服务的功能应用于如客户支持、定制化服务、搜索、数据提取和分类中的实践之中。
 
微软表示这是对与 OpenAI 持续合作的一部分,同时为了更好更负责任地提供人工智能服务,微软和OpenAI正在合作仔细评估用例、学习和解决潜在的风险。
 
  • ChatGPT加入Office全家桶
 
除了Bing和Azure之外,目前微软还在着手将包括ChatGPT等OpenAI 的人工智能工具整合到 Word、PowerPoint、Outlook邮箱等一整套办公套件之中。而一旦进行了有效集成,这未来将很可能改变超过 10 亿人编写和演示文档、演示文稿和电子邮件的方式。
 
过去一两年来,微软不断在其生产力应用程序中使用了注入了越来越多的人工智能服务。比如在Word 和 PPT中使用 AI 算法自动建议图像和幻灯片字幕,使用 GPT-3 构建了 AI 驱动的自动完成功能,在Microsoft Teams 使用 AI来改善回声、中断和声音的效果,Microsoft Editor 使用 AI来执行拼写检查、语法检查和文本预测来改善写作等。
 
最新消息显示,微软目前已经将最新的GPT 聊天机器人模型(目前是 ChatGPT,很快将成为 GPT-4)整合到 Word、PowerPoint 和 Outlook等生产力套件中。最新的GPT技术将允许用户运用更灵活的方式检索内容,同时最重要的是帮助用户快速生成个性化文本。也就是说,最近一两个月来很多ChatGPT用户的用例都可能变成Office的一项新功能。
 

图片来自Twitter

 

比如,当你生病想给公司请假时,你只需要输入“给团队写一封病假邮件”,Outlook就能帮你生成一封完整、正式的请假邮件。当你用Word撰写工作周报时,你只需要写入几个关键词,AI只用花几分钟就能帮你自动写出过

open ai最新功能 openai未来的发展


硕大的贴吧容不下一个“不”字。。。A如今的表现,虽然只有17个英雄,不能使用某些分身道具,但是哪怕是这样,他居然能打得人类玩家不敢接团,不敢刚正面,人类反而认怂、带线、走歪门邪道,耍所谓的小聪明才能艰难取胜。这难道不是AI的强大吗?说一声AI强怎么了?AI99%的胜率,说一声人类一败涂地很过分???还有人为了所谓的“面子”、“种群认同感”非要不认,非要说自己强。请问,AI才发展这几年就能在有一定限制的DOTA下获得99%胜率不厉害?不出分身、死灵书是对人类的削弱?你到底知不知道,分身、死灵书或许对于人类而言只不过是带线或者躲技能的工具,但是对于AI,那是多了几个英雄!只有17个英雄是对人类的削弱?你怕不敢想象AI玩米波的样子,那不是5V5,是9V5。帕克几乎死不了,TB、骑哥就是一个军团!AI才发展几年,就有如此让人敬畏的表现,按照现在科技的力量,全英雄挑战完胜人类几乎可以说是必然的事情请敬畏科学别人强就是强,非要往自己脸上贴金?还不支持你,不支持人类就是人奸?恶心不恶心? 下次先把自己的唯一关注取消了再来发帖吧 你这样让我一点破案的兴奋感都没有 4000分以下的队伍有赢的吗?跳刀的班子是3/2,可人家有两个ti冠军啊。 分身和死灵书要是有,ai感觉更强啊,微操无敌 总结,承认自己很菜很难吗? 我再列举一下AI强于人类的几点:1、AI无与伦比的反映速度;2、对血量的把控,对技能伤害的把控,团战走位的精确计算;3、绝对平和的心态,无论局势如何,不会心态崩溃,也不会浪得飞起;4、最厉害的是超乎常人的学习能力,几乎可以学习所有技巧,然后筛选得出最优解。不得不说,AI能有今天的成就确实值得尊敬,而不是在那里阴阳怪气的酸别人的成果 我觉得真正的战胜人类是和阿尔法狗用让人类根本想不到的战术和配合操作战胜人类 而不是和脚本一样的快速反应 别的我不知道,跳刀那个班子赢了三把,正面团把ai打的鸡飞狗跳 不是说不尊敬ai,是你这个ai8行理论上足够强大的ai能完虐人类,你想想光是有精准的伤害计算和执行力就够爆打99玩家了。为什么我要说光有?因为这个ai就是个带着200ms脚本的疯狂电脑。我承认这ai是比游戏里自带的疯狂电脑在战术层面上要强,但是塔前插假眼腾格子,隐身等于无敌,出装没有独立思考的能力,对比人类真的厉害吗?人最难能可贵的不就是其创造力和出于对未来的预判,在ai上我完全没有看到这两点。这次比赛无异于让人和汽车赛跑,让人和游艇比谁游泳快,都是以己之短碰敌人之长。总结:打不过,看不起。 综合看了几场下来,确实ai的反应速度超过了人类,反应速度对于Dota2有多重要,跳刀,bkb的秒开往往决定着战局的胜败,这是这类游戏的独特之处,竞技游戏都是极端依靠反应。机器远远超过人类。为什么人类打不过,因为人类的强项在于战术,在于出乎意料的创新打法,而ai的胜利在于限制了人类的一切可能的创新,变量,影响战局。因此他们只有十几个英雄,用鸡都有限制,人类的可能的意外的,或者说Dota2游戏的魅力在于变化,被完全限制住了,依靠反应就能赢。ai可以慢慢增加可使用的英雄,但是必须考虑到一切的变量,程序会越来越大。放开了限制,ai永远不可能穷尽一切变化,创新。人类毕竟是创造者,ai只是亦步亦趋的学徒,把一切经验吸收,再吸收。反应速度绝对不可能决定以后的一切战局,当一切都放开以后。 。。然而这个ai并没有体现出人工智能的强大之处,顶多只是电脑计算能力强大,对血量的把控和技能的释放一个简单的脚本就能完美的做出和它相同的操作,而人工智能的学习能力在它身上并没有很好的体现,起码打了这么多把遇到隐身直接懵逼,所谓的最优解也只是靠自己0.2s的延迟和零失误的技能衔接打出来的无脑抱团推,对线,视野,补刀,带线没一个值得人学习的地方,唯一无敌的团战以人类的反应速度和配合根本不可能模仿的了,实在不知道有哪一点值得尊敬。。 还有说什么分身开放,召唤物开放ai是会爆打人类。你知道为什么只有17个英雄吗?为什么不开放这些东西吗?真就照顾人类?说白了就是ai目前尚未达到这个水平,无法完成全英雄的计算,更不用说召唤物和分身了。有关注过opai的就知道之前开发者试过25个英雄,得到的是一系列的bug以及无法解决的问题。ai不是人创造出来就撒手不管让他自己进化,如果人达不到这个层次的话全英雄设计不可能出的来。依我个人观点想在dota2里设计全英雄全道具爆打人类还能自主创造的ai,起码近10年内不可能,0可能。这个opai早在ti7就有了,折腾了这么久也就这点进展,越往后无论是经济还是人力上消耗都吃不消,很可能过两年,英雄增加到二三十个就停了,接着dotaai又会无人问津。 别说那么多没用的,你ai单排打天梯到前一千,不然吹nm呢 没把我头拧下来的,我都看不起。打肿我,我也要bb。这游戏的玩家就这样,平时看直播,全是弹幕指点江山,maybe皇开直播不也是天天被喷?职业圈更是没人不被喷菜的。一个ai你想也知道是什么风评啊,连粉丝都没的东西,在贴吧挨喷就完事了。 都很浮躁