将本站设为首页
收藏花荣官网,记住:www.unuen.com
账号:
密码:

花荣书院:看啥都有、更新最快

花荣书院:www.unuen.com

如果你觉得好,恳请收藏

您当前的位置:花荣书院 -> 大时代之巅 -> 第2045章 AI改变世界

第2045章 AI改变世界

温馨提示:如果本章属于内容错误等情况,请点击下面的按钮发送报告,我们会在一分钟内纠正,谢谢

据量太少,中文的数据量很大,可是因为环境的限制有价值的数据也很少。

所以,想训练出世界级的AI模型,就只能用英文语料来训练。

这就需要一些弱势语言的AI模型,要有语言转换能力,去转换成英文。

就像使用文心一言,让他画一个起重机的图片。

结果画的是鹤。

这就很让人费解。

其实很简单,起重机的英文是crane,而crane在英文里主要是指鹤。所以AI模型就画出了鹤的图片。

又比如“可乐鸡翅”这种,放在中文语境里,其实很好理解,就是一道菜。可是,这里面有一道翻译的手续,把“可乐鸡翅”翻译成英文,在翻译过程中就造成了信息离散,导致画出来的可乐和鸡翅。

ChatGPT一样会遇到这样的困境。

用英文向ChatGPT提问,回答的速度会非常快,而且准确度极高;如果用中文、日文、韩文、法文、德文等其他语言来提问,反应速度就会很慢,给出的答案也会错误百出。

因为其他语言的数据量太小了,训练出的模型就不够智能。

只有英文版最智能。

文心一言想要表达得智能一些,就不能对接中文的语料,要去对接英文的训练数据才行,然后背后再增加一套翻译算法和内容审查算法。

所以,想做出一款伟大的AI产品,除了在人工智能领域的顶尖算法之外,还有很重要的一个因素,就是训练AI模型的数据。

这些数据里,有些是开源的公共数据,全世界都可以用。有一些是私有数据,只有自己可以用。

像微软、谷歌、Facebook这种硅谷的巨头公司,除了可以使用庞大的公有数据外,还有庞大的有价值的英文私有数据可以使用,他们做出来的AI模型就会比只根据公有数据训练的AI模型要更加强大。

所以,周不器对内容很重要,尤其是海外的英文内容。

这些都是私有数据,都有可能成为紫微星在未来世界竞争中最宝贵的资产。

如果拉里·佩奇说的这款Knol真的是对标维基百科的产品,那就太有意义了。维基百科是公有数据,Knol就是私有数据。

“维基百科更像是一个词典,内容都比较基础,是偏大众的产品。Knol是由一部分有能力的权威用户来共同协作,用来解释一件事物的是什么、怎么做、起因经过结果及其周边事物,并且


  本章未完,请点击下一页继续阅读!

看了《大时代之巅》的书友还喜欢看

一元首充:我竟是五百强幕后老板
作者:毛洋芋
简介: 【游戏成真】【养成类】【职场双向奔赴】\n下载《幕后玩家》这款游戏后,一元首充,我成...
更新时间:2026-03-04 21:17:50
最新章节:第187章 这是什么神仙公司
渣夫骗我领假证,转身携千亿资产嫁权少
作者:唐小糖
简介: 【渣夫火葬场+男主先婚后爱+虐渣打脸】

结婚两年,江染补办...
更新时间:2026-03-04 21:01:40
最新章节:第一卷 第354章 要他们千百倍的还回来
我在忍界掀起百鬼夜行
作者:暝天想睡觉
简介: 胧月下,五影退避,尾兽匍匐,圣地紧闭。薄雾后,一道道猩红的妖瞳缓缓睁开,滔天妖力肆意...
更新时间:2026-03-04 20:39:00
最新章节:第九百零四章 血脉奔腾,来世注意
网游:无垠无尽之主
作者:随性之人
简介: 【地狱难度+绝望开局+亿级+世界观宏大+史诗感+独狼+剧情流+优雅+单刷横推】\n周...
更新时间:2026-03-04 21:29:21
最新章节:第1239章 那浮现门扉上的眼眸
女娲妈妈说,修仙不需要灵气
作者:清茶伴余生
简介: 同学A:“你灵气亲和度才1%,怎么修炼?”\n秦乐:“我妈说不用练灵气。”\n同学A...
更新时间:2026-03-04 21:34:59
最新章节:第237章 防止最坏的结果
李嘉宁的奇妙之旅
作者:张鼎鼎
简介: 你的容貌不是你能决定的,家庭不是你能决定的,智商不是你能决定的,人生的大多事情都不是...
更新时间:2026-03-04 21:06:22
最新章节:617 第六百一十七章 走入新时代