原标题:语言学与人工智能的未来
当
谈及人工智能,很多人会不约而同的认为—机器人!这是受到了思维定式的限制。
人工智能,是一种对人类智能现象的模拟,其中包括对人类思维过程的模拟。人工智能的发展似乎并不遵循由低级到高级的进化过程,而是会在一些“点”上,也就是某单一维度上突然变得比人类“聪明”很多。而这样的现象,在动物当中也可以发现,比如一个松鼠就可以记住成百上千的松果埋在哪里,在这方面它优于人类。
人类智能是综合多维的,或许我们的学习、记忆、信息搜索、决策、判断或者加工能力并不是最了不起的,AlphaGo已经证明,我们人类在这些方面可能不如深度学习后产生的人工智能。但是,人类大脑最大的作用是用来判断过去信息的对或错吗?
什么是人类智能?
字面上看,它包括“智”和“能”两种成分。“智”主要是指人对事物的认识能力;“能”主要是指人的行动能力,它包括各种技能和正确的习惯等等。人类的“智”和“能”是结合在一起而不可分离的,是人运用自己已有的知识和经验来学习新知识、新概念,并且把知识和概念转化为解决问题的能力。人类的劳动、学习和语言交往等活动都是“智”和“能”的统一,是人类独有的智能活动。而人类语言是人类智能的最高层的抽象表达。
人类智能可以分类为:
什么是语言?
语言是思维的工具和物质外壳,二者密不可分,这一点已经成为共识。我们知道自己是人,便是从语言的概念认知开始的。因为语言,世界有了清晰的外在眉目,语言编制了万千世界,用概念和意义符号架构出世界的秩序。而思维的概念及其逻辑必须依赖于语言的生成。
人类的语言是一套复杂的符号系统。换句话说,人类用来交际的不是实实在在的事物,而是代表事物的符号。一个人掌握了符号,也就知道了符号所代表的东西。符号的最大特点就是主观性或者说任意性,我们常说玫瑰代表爱情,其实玫瑰与爱情这两者之间并不存在必然的联系(玫瑰的自然属性不包括代表爱情),只是我们人为地主观赋予了这种联系,并且使之成为了整个社会的一种约定俗成。
从这个角度看,人类语言是对现实世界的符号化编码,然而面对大致相同的现实世界,各民族乃至各村落的人们却可以使用完全不同的编码来表述他们的世界,并使之正确地被同母语者解码。动物的交流方式恐怕不具有这种特性,因此动物的“语言”是信号,而非符号,符号系统属于理智的、高层次的信息传输形式。
什么是语言学?
语言学,顾名思义,是研究语言的学科。但是语言学不是指学习某一门或几门具体的语言过程。语言学的任务是研究、描写语言的结构、功能及其历史发展,揭示语言的本质,探索语言的共同规律。因为只有人类有语言、使用有声语言进行交际,因此通过语言研究,可以更加清楚地了解人类在世界或宇宙中的位置,从而更加透彻地理解人类的本质。这应该是一个永恒的、根本性的哲学问题。
人工智能时代的语言学
人的思维过程可以理解为符号处理的计算过程;人类的语言理解过程也可以理解为是一种在知识表示上的计算过程,这使得计算机理解自然语言在技术上具有可能性。因此,对语言的认知研究的自然延伸便是对语言的计算分析。
对语言有处理能力是人工智能的一种高级表现形式。
语言智能的范畴的不完全统计:
· 词法和句法分析
· 语义分析和理解
· 语言模型
· 语音计算
· 文本分类和聚类
· 信息检索和信息抽取
· 自动文摘和自动作文
· 自动问答和人机对话
· 机器翻译
自然语言处理和计算语言学
人工智能领域的一个重要分支自然语言处理NLP(Natural Language Processing)。NLP已经不是新鲜事,它从计算机科学的角度出发的,算是计算机的一个子学科。
加州大学洛杉矶分校视觉、认知、学习与自主机器人中心主任朱松纯教授将人工智能归纳为六点(如上图)。这些领域目前还比较散,目前它们正在交叉发展,走向统一的过程中。
NLP目的是高效的可用于处理自然语言的算法。如基于字序列标注的中文分词,HMM词性标注,CKY, Early算法,N-gram,噪声信道模型,这些应该都算是NLP的成果。统计NLP已取得巨大成果,但其极度以来统计手段,相比之下深入的语言学思考少很多。
我们为什么要对话呢?语言的起源就是要把一个人脑袋里的一个信息表达传给另一个人,希望通过对话形成共识,形成共同的任务规划,就是我们一致行动。我们愿意同一个人聊天并产生亲密感,并不是因为他说出跟别人一模一样的话,而恰恰是因为他反其道而行之,说出与众不同的见解,让聊天产生火花。
基于大量语料训练下的机器学习,本质上可以看做“概率最大化的拼接”,即总是采用最“常见”的方式去“说话”,“人都云,才云”,因而生成的语言常常令人感到乏善可陈。遇到今天的瓶颈,许多NLP的研究者都在引入一些语言学的知识来帮助他们提取更多的训练特征,和更靠谱的思维角度。
计算语言学是从语言学的角度出发的,是语言学的一个分支,该学科的目的是提出一种可被计算机处理的语言学理论、框架、模型,例如WordNet。WordNet是由Princeton 大学的心理学家、语言学家和计算机工程师联合设计的一种基于认知语言学的英语就属于此类。
NLP和计算语言学总体趋势是二者的界限开始变模糊了。计算语言学方面,虽然说理论研究工作,但衡量一个理论是否有效,还是得放在真实语料上进行实验才知道。计算语言学不光是会计算机,是利用语料库、计算语言学为本体研究服务,为语言教学服务(母语的和对外的),还是面向文本的、语音的、操作系统的、具体应用软件的等等应用性质的,还是发展计算语言学本身的理论和技术的。
因为计算语言学有着自己的特性,它要求研究者必须同时拥有广阔的知识背景,尤其是在语言学和计算机技能方面。拥有对语言的感悟和理解是语言计算的基础,语言与思维的密切联系,语言的变化性、变异性,内省性等等都不为人们所把握和确知。计算机技能则是我们对于语言学的现代化、科学化、精密化,还不只这些,也许更是革命化。
人类语言&人工智能语言
我们现在已经开始大量接触机器生成的语言了,在线翻译、机器人客服的自动答复,以及Siri、小冰等机器人。越来越多的文字工作和应用,正在被机器所替代,天气预报、体育赛事的解说、新闻摘要等。一方面,机器语言目前还远远低于普通人类使用语言的能力,另一方面,计算语言学大有可为,以后的路还很长。以机器翻译为例,中国数学家、语言学家周海中教授曾在论文《机器翻译五十年》中指出:要提高机译的质量,首先要解决的是语言本身问题而不是程序设计问题;单靠若干程序来做机译系统,肯定是无法提高机译质量的。另外在尚未明了人脑是如何进行语言的模糊识别和逻辑判断的情况下,机译要想达到“信、达、雅”的程度是不可能的。人工智能的发展,需将认知语言学、心理语言学、社会语言学的研究成果运用到人机对话的设计中。
I cnduo’t bvleiee taht I culod aulaclty uesdtannrd waht I was rdnaieg. Unisg the icndeblire pweor of the hmuan mnid, aocdcrnig to rseecrah at Cmabrigde Uinervtisy, it dseno’t mttaer in waht oderr the lterets in a wrod are, the olny irpoamtnt tihng is taht the frsit and lsat ltteer be in the rhgit pclae.
2017年10月30日,曾任微软亚洲研究院院长兼首席科学家、微软全球执行副总裁沈向洋博士走进清华大学高等研究院杰出学人讲座,发表题为《理解自然语言:描述、对话和意境》的报告,他提出,在下一个十年,人工智能将在自然语言处理有所突破, “懂语言者得天下”。
如果你对计划计算语言学这门学科感兴趣,建议大学阶段课程:
1) 语言学:现代汉语、中西方古代语言学史、现代语言学史、语言学理论与方法、词汇学、句法学、语义学、语用学等
2) 计算机相关:人工智能、现代逻辑、模式识别、数据结构
3) 数学:高数、概率论与数理统计、离散数学、线性代数
4) 计算语言学:中文信息处理概论
参考文献:
[1] 尚富华.李军.人工智能及其运用[M].北京:石油工业出版社,2005.5.
[2] 钱学森.关于思维科学[M].上海:上海人民出版社,1986.年.
[3] 何华灿等.人工智能导论[M].西安:西北工业大学出版社,1988年.
[4] 蔡自兴.徐光祐.人工智能及其运用[M].北京:清华大学出版社,2004.8.
[5] 范德清.魏宏森.现代科学技术史[M].北京:清华大学出版,1988.
[6] 王永庆.人工智能原理与方法[M].西安:西安交通大学出版社,1999年.
[7] 张云峰.人类智能与人工智能[J].深圳.沿海企业与科技,2003.3.
——————–
原创出品
===============
17710862437返回搜狐,查看更多
责任编辑:
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/10985.html