沃森 Watson
沃森是IBM制造的电脑问答(Q&A)系统。IBM介绍时说“它是一个集高级自然语言处理、消息检索、知识表示、自动推理、机器学习等开放式问答技术的应用”,并且“基于为假设认知和大规模的证据搜集、分析、评价而开发的DeepQA技术”。
沃森(英语:Watson)是能够使用自然语言来回答问题的人工智能系统,由IBM公司的首席研究员大卫·费鲁奇所领导的DeepQA计划小组开发并以该公司创始人托马斯·J·沃森的名字命名。
2011年,沃森参加综艺节目《危险边缘》来测试它的能力,这是该节目有史以来第一次人与机器对决。2月14日至16日广播的3集节目中,沃森在前两轮中与对手打平,而在最后一集里,沃森打败了最高奖金得主布拉德·鲁特尔和连胜纪录保持者肯·詹宁斯。沃森赢得了第一笔奖金100万美元,而肯·詹宁斯和布拉德·鲁特尔分别只有30万和20万。赛后,詹宁斯和鲁特表示将一半奖金用于慈善事业,IBM公司也将沃森的奖金分给了两家慈善机构。
沃森在比赛节目中按下信号灯的速度始终比人类选手要快,但在个别问题上反映困难,尤其是只包含很少提示的问题。对于每一个问题,沃森会在屏幕上显示3个最有可能的答案。沃森4TB磁盘内,包含2亿页结构化和非结构化的信息,包括维基百科的全文。在比赛中沃森没有链接到互联网。
硬件
根据IBM的说法:沃森是一台专为复杂分析而优化设计的系统,集成大规模并行处理器POWER7和IBM DeepQA软件使其能在3秒内回答危险边缘的问题成为可能。沃森是由90台IBM Power 750服务器(还包括10个机柜里额外的输入输出端口、网络和集群控制器节点)组成的集群服务器,共计2880颗POWER7处理器核心以及16TB内存。每台Power 750服务器使用一个3.5GHz、8核心,每核心4线程的POWER7处理器。只有POWER7处理器强大的并行计算能力才能勉强运行沃森安装的IBM DeepQA软件。
John Rennie说,沃森每秒可以处理500GB的数据,相当于1秒阅读100万本书。 IBM研发负责人和高级顾问Tony Pearson估计沃森的硬件花费近300万美元,其80 TeraFLOPs的处理能力在超级电脑世界500强排名第94,在超级电脑世界50强排名第49。 Rennie还说,比赛的数据是存放在沃森的内存中的,因为硬盘的访问速度太慢了。
软件
沃森的软件由数种不同语言写成,包含Java、C++和Prolog等,并且采用Apache Hadoop框架做分布式计算,还有Apache UIMA(Unstructured Information Management Architecture)框架、IBM DeepQA软件和SUSE Linux Enterprise Server 11 操作系统。“……超过100项不同的技术被用在自然语言分析、来源识别、寻找并生成假设、挖掘证据以及合并推翻假设。”数据
沃森的信息来源包括百科全书、字典、词典、新闻和文学作品。沃森也使用数据库、分类学和本体论。特别是DBpedia, WordNet,和Yago。IBM小组为沃森提供数百万的文档,其中包括字典、百科全书和其他能建立知识库的参考材料。尽管沃森在比赛中没有链接互联网,它4TB的磁盘上仍有2亿页结构化和非结构化的信息供其使用,其中包括了维基百科的全文。
评论已关闭