最近看到 EmiNarcissus 想做个春菜 BOT,想到了大概在两年半之前左右自己也写过一个人工智能。于是写了这篇文章闲叙。

记得是一个暑假的下午,心血来潮想写个人工智能程序,于是就兴冲冲的到电脑城买了块1T硬盘,准备用来收集数据。开发代号也很快就定下来了——“Chobits”。真正写起来之后才发现这个东西确实很难写。刚开始我认为犯了一个错误,为了追求最后的结果而采用了自顶而下的开发策略,后来逐渐发现带来一些问题,很多所谓“基本”的功能在碰到时才去编写,相对来讲整个代码就显得非常琐碎凌乱。并且一些较早开发的功能明显完整度不及后来的高。

在那段时间里刚开始学习了遗传算法和模拟退火算法,后来又粗略的学习了一下一些具体的技术,譬如马尔科夫链、语义学之类的。作为一个交互型人工智能,Chobits计划需要能够“理解”使用者提出的话,那个时候我还不知道(伪)春菜。回顾一下当时的计划,我想Chobits计划做到的是进一步的“理解”,而不是概率匹配。

当时语音识别等产品主要用的就是马尔科夫链这样的概率算法,我想通过对语法结构的分析来进行运算。因为不大明白中文的分词原理,所以直接拿英语作为交互语言。但是很快发现这条路有点问题,语法结构本身是多变的,而且语言本身包含的不仅仅是语言的因素,要构建一个相对成熟、交互性强的语言系统,看样子必须得要有完善的感情、认知功能。在大概收集了100M+的语法结构数据之后我把这项工作放在一边,开始考虑这个人工智能究竟应该怎么设计。

后来我想了一想,采用了自下而上为主的设计模式。我先建立了一个虚拟环境。我本来想模拟一个完整的神经网络结构,不过想想电脑的并行运算能力不够(恐怕现在全世界全厉害的HPC也不够),后来采取了无监督式学习网络,从感知开始构建语言(我认为凭我的水平在很长一段时间内都无法实现“情感”的目标)。当然,神经网络输出的一堆数字全然是无法理解的,我大概向整个系统输入了十来句语法模板。然后我就让这个 AI 在网络上搜集数据,大多数用于训练的文本是长期或者专题性的新闻,因为文字、语句之间有联系,而且正是我想要的逻辑上的联系。神经网络逐渐发展壮大,到最后我终止这项计划的时候已经积累了靠近 4.5T 的神经权重数据,以致数据分析非常缓慢,推理的速度远远低于预期,况且这么多数据仍然是杯水车薪,它还是只能解决简单的交流问题,不过处理一些稍微有点复杂的问题,并且神经网络算法本身也有概率算法的影子。我是想让Chobits计划成为所谓的“通才”,而且最好都是专家。当然啦,这个愿望终究是个愿望,不久我就终止了该项计划。

我正儿八经系统的接触有关人工智能的知识是很晚的事情了。在看到希尔勒提出的中文屋理论之后,我开始怀疑,当初认为的所谓“理解”到底是不是理解,无非就是强人工智能与弱人工智能的区别。我开始纠结,所谓的强人工智能到底能不能写出来?单纯就理论讲,我更加维护弱人工智能的理念。因为到现在,人类对于“智能”(说“意识”也好)一次都没有一个靠谱的定义,如同就像“时间”这个词一样,是一个无法定义的东西。

但后来想想还是不对。庄子说过“子非我,安知我不知鱼之乐?”你怎么就知道我没有智能呢?又想到一个比方,假使有一个非常大且复杂的机器,它可以智能的响应外界的一切行为,但是以我们的尺度只能看到齿轮与链条,看不出它有智能。那我们现在把他缩小缩小缩小再缩小,缩小到一个大脑的尺寸,安放在一个生命体里,于是这个生命体就能够智能的响应世界了。那这个生物体有没有智能呢?这个例子是中文屋的另一个说法。实际上大脑也是这样一个情况。

所谓一个东西是否具有智能,实在是一句不可证伪也无法证明的话。作为一个人工智能的开发者,或者说一个用户,我更关心的是,人工智能是否能解决我的问题,而不是它具体的实现过程。不过无论如何,在学术的层面上,总该有这些刨根究底的思考。我想,人工智能取得飞跃之时,就应该是在人类的生物的大脑、中枢的结构功能作用原理了然于心之日。在那个时候,人类就真正的成为自己的造物主了。

6 Thoughts on “人工智能两三事

  1. 话说illusion对ai钻的好深Orz
    中文的分词,句法分析虽然复杂,不过即使是英文也很难处理,稍微复杂一点的从句或者倒装就能让一个bot傻眼,从上至下确实难做,看了点ai programming 的资料我也暂时先放置了ai的设计先去搞xmpp的基础结构了。
    关于上下文问题,这或许才是最麻烦的问题,分词,句法逻辑分析,构建上下文,整体做下来绝非一个小项目能涵盖的,有条件了真想多弄点资料好好看看。
    话说乃折腾这些的时候不耽误上课的?

    • @EmiNarcissus, 折腾 AI 的时候还在初二初三的时候,大概延续了一年多,每天三个小时写代码够了,主要也不着急写完代码,可以慢慢磨,不过后来就出现。。不记得以前写过了什么了。

  2. 写程序渣渣表示有些难看懂呢…

  3. 嘛说起来之前也想过做一个AI之类的东西不过完全木有了解得这么深。。说起来白丝魔里沙也是类似的产物吧?

    • illusionwing on 2012/01/09 at 23:18 said:

      @灵曦, 白丝魔里沙的话。。应该是是通过对对话库进行检索、综合分类的吧,也是现在很多“对话”机器人的通行模式。

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation