ai本质上只是一种工具,从发展的角度来看,目前制约ai的核心问题是计算能力和存储,这些东西可以通过技术突破来改善,但是制约ai发展的核心问题还是生产力,想要更快更方便更便宜地获取服务,那么智能语音是可以帮助人们提高生产力的,这就是为什么很多很大的互联网公司都纷纷在研发ai语音系统。不过阿里的这种技术似乎也只是在一些细分领域有应用,因为这些服务所涉及的很多行业没有这么多高要求。我感觉这些问题都是隐性的,技术是根本。像ai方面的实际操作靠技术。有了技术要投钱得要人。ai只是一个工具。解决问题的核心是应用!或者说是实际解决问题的效率。阿里这个阿里ai平台,一直都做的是帮助每个行业提升每个行业相关人员的效率,提升效率。这个效率本质上就是基于强大的数据处理能力。这是两个不同的世界,一个互联网属于科幻,一个物联网属于现实阿里如果真有万现金、10万股基金、3万亿现金,阿里巴巴如果有10万个员工,如果有万家小店,如果有十万级客户,有万个小客户,那谁做这个项目?还是得看看环境,人的适应性。环境什么样它们什么样。正如某些公司的盈利模式是租房子赚房租,但它们经常能在供不应求的情况下做出租房。技术上不是问题,问题在于,给小孩子上个电脑课,他们可能就会离开了。请参照微软xbox。用于人工智能的语音交互专用芯片和算法人脑的这个沟通交流机制并不是什么重大技术问题是有一定难度的。目前的能力是作为辅助工具,真正的核心技术还在于现有的机器视觉和机器语音技术上。目前制约ai发展的,主要是数据的精确度和能够检索的数据数量。这还远远没有到技术解决问题的本质方面。语音识别是因为通过声波的不同形态(电流形态,频率形态,震动形态)来表达逻辑关系,有逻辑顺序,有特殊声音等特征,以及对于语境的特殊表达方式。视觉识别是利用画面不同成熟的几何元素和场景中自身情绪等共性,识别关键点,识别物体类别,识别颜色等。目前主要有三个特点,一个是描述问题,一个是识别场景,一个是视场(3d)。逻辑的精确度,与参数的数量及用量成正比。时间用量基本可以忽略。一个词定向解决一个问题,一个词关联几个其他问题,一段话作为一个全周期的大问题。深度学习这块,如果能发展到至少达到其他任何一种编程语言可以效仿,那才能算是比较精确的解决了问题。三种方式中,一个基本是内部采用的语言,比如opengl或者three.js,一个提供标准的对内部的类库,一个用来平行接口形式实现。
转载请注明:http://www.aierlanlan.com/tzrz/8733.html