第一百六十七章 李总震惊!

章节报错(免登陆)
下载APP,无广告、完整阅读

顶点小说(dingdian666.com)更新快,无弹窗!

过多年积累,度娘有词条功能。
    所有词条都是千千万万网友在度娘公司的引导下完善的。
    最初阶段也非常简单,词条还和度娘的虚拟币挂钩,一些完善词条的用户能够得到虚拟币奖励。
    后来把数据库建立起来以后,就自发形成了良好的知识分享环境。
    大家都可以修改词条,最后把自己的名字挂在贡献榜上。
    正是因为这个原因,其实度娘的词条也不是十分准确,存在大量被编造的信息。
    这方面还闹出过不少笑话,有学者通过度娘百科写论文。
    而且写的还是历史类论文。
    他以为度娘百科是准确的资料,便没有多加验证便按照度娘百科的资料写好了论文。
    最后导师看了以后,才发现问题。
    原来度娘某些历史知识,竟然都是某网友编造的信息。
    另外度娘也从外网的维基词条网站复制了很多内容,而维基网站其实也是网友自主上传的信息,大量虚假信息就从外转到内,某些人还以为国外找到的是史料,但其实就是编纂的信息。
    曾经还有网友在维基上编纂了白熊国历史,足足写了百万字。
    将白熊国古代某时期的史料,编纂得和真的一样,还虚构了某个银矿,甚至是发生的战争。
    这些知识误导了不少人。
    李言洪不知道对方的数据从哪里来,如果也是互联网上搜集,也许也有不少错漏的地方。
    但很快让他震惊的事情发生,通过夏为搜索出来的结果,非常有条理性。
    比如搜索某个历史人物,便可以简略地看完这个人一生的介绍,资料被详细规划出时间线,文字多达数十万字,简直就像是某个人的自传一样。
    就连搜索李言洪自己名字,也会找到他的所有轨迹。
    当然这些都是互联网上所有报道,被整合后弄成的简介介绍。
    文字很多,如果想要知道更细节的内容,可以进行二次搜索,只要输入关键词,甚至是问句,夏为搜索都能给出答桉。
    陆杨看见搜索结果,也是欣慰不已,小天也许在思维能力上,还没有达到成年人的思维能力。
    可数据整合上,已经超过了所有人类。
    李言洪搜索自己的名字,小天第一时间在后台利用度娘搜索,随后将数万个网页,包括里面的内容,在几毫秒内整合完毕。
    这其中就包括媒体报道的时间线,最后李言洪便看到人工智能利用网络上无数数据,给它制作的数十万字简历介绍。
    陆杨见李言洪十分震惊的脸色,笑道:“还可以试试搜索历史人物,某些冷僻知识,十万个为什么都可以搜索,它会给你答桉,因为我们的小天人工智能,数据库已经连接上国家电子图书馆,z-library全球最大的电子图书馆、谷歌电子书数据库等等,前者有近百万本图书数据,后者有945万多本图书数据。”
    “不管是文字版,还是pdf图片版本,我们的人工智能都能识别,读取图书数据,并且在你输入关键词后,找到对应答桉。”
    “这只是开始,目前国家图书馆的线下藏书达到了2亿册,几乎把人类所有通过正版出版的书籍都收纳了,我们接下来会将这2亿册书籍都电子化,接入人工智能数据库。”
    陆杨前面说的是实话,他前段时间便打通了数据连接渠道,让国家图书馆线上图书和小天连接,当然因为版权原因,只能内部使用。
    这是靠着他和官方良好关系才做到的。
    至于z-library网站,这是国外的亚马逊搞出来的网站。
    用于出售电子书,利用kindle这个读书平板,可以付费阅读书籍,当然z-library数据库内有大量免费书籍,都是版权公开的一些书。
    陆杨没有攻破对方收费系统,把别人数据库的书都获取,并不是他不准备这么做。
    而是现在小天智能还不够高,陆杨怕让它动手被人发现。
    获得数据库后,自然也不能直接使用。
    陆杨想等一段时间,小天智能更高,再把所有数据转化一下,相当于重新翻译,把书籍内容重构。
    这样就没有版权纠纷了。
    除了亚马逊的电子书,谷歌的开放电子书项目、微软的电子书项目,也都让陆杨连接到小天服务器上。
    最重要的还有各种论文数据库。
    这倒是比较简单了,因为大量论文版权就在作者手中,他们又没有收费。
    而刊发的期刊,反而将他们收纳进数据库后出售给其他人。
    陆杨也没用攻击sci数据库,而是从免费公开的论文网站获得数据。
    “所有互联网上的信息,都在我们整合计划内,论文、各种书籍、记者报道、网站的稿件、网友社交评论,所有网上能搜集到的公开的信息,都会在接下来一段时
章节报错(免登陆)
下载APP,无广告、完整阅读
验证码: 提交关闭