Sunday, April 24, 2016

人工智能有多远(2)--关于‘深度学习’的一点浅见

前一篇讲到的AlphaGO,用到了现在特别火的一个机器学习的技术,深度学习。深度学习主要的应用范围是图片,在语音和text-mining方面也有一些应用。在图片方面应该说目前没有别的替代。但是一个技术火不火,不能用它适用的范围来评判。一个真正火的技术,要在那些根本不适合的地方也被人用到。这就好比一个牌子的包包怎么能说很流行呢?如果只是年轻的女孩子背一背,那不算流行。只有等到根本不再适合的人群,比如我们这个年龄的大妈,还有老奶奶,也去背,那才算是真正的流行。

根据这个标准,深度学习的确是火起来了。因为我观察到两个现象,第一个,一些根本不适合用深度学习的领域,也在用深度学习。很有代表性的,就是我们生物信息了。几年前,我读到一篇文章,讲到只要用了深度学习,从DNA的序列直接就可以学习出来能得啥病。其中有一段,讲到他们用了深度学习之后,准确性的p-value是1e-300。读到这儿我就笑了,作者显然没有啥基本生活常识。宇宙中的原子才1e280个左右。生物信息目前最大的问题恐怕就是很多组在比宇宙大的多的scale上operate。其实,他们在算这个数据的过程中,机器正好被宇宙粒子击中而出错的概率要远远大于这个p-value。至于他们这个算法或者数据上出错的概率,或许是应该接近1的。根据我的经验,深度学习在这方面的performance应该不会超过线性回归。

第二个现象,就是突然生出了一堆深度学习专家。就说我们系吧,近些年一下多了好几个深度学习专家。我有一次,就听这么一个专家说了,其实他们也不知道咋弄,都是直接把别人的模型拿过来做预测。根本没有训练的过程。至少我们领域现在大部分这种所谓深度学习专家都是这种似懂非懂的。

这让我想起一个故事。居里夫人发现镭之后,放射物质当时被人们认为是无所不能的,就好像现在有些搞机器学习的傻白甜认为深度学习是无所不能的一样。到了什么程度呢?当时的产品,特别是食品,饮料,都以加了放射性物质作为卖点。掺了放射物质的饮料可以当作包治百病的保健品。这个事情一直持续到居里夫人因接触过多放射物而病逝。其实科学史上类似的事情特别多。一个热点,常常能够迷惑大众,又使后来人攀错科技枝。

正因为这个原因,我对深度学习这个技术一直比较抵触。直到最近,因缘巧合,才开始做一些这方面的实验。现在有些人出于不可告人的目的,造出一个假象,好像深度学习是终极solution。又有一些人,由于脑力所限,就把这个假象当真了。最可笑的就是常常看到一些文章,号称深度学习的结果比人眼label的还好,同时,用的是人眼label做的标准。这就好像说我们现在天气预报的准确度,已经超过了真正天气是怎样的准确度。本身就是一个悖论。至少根据我这段时间实验的结果,深度学习,即使是在它最适合的图像识别方面,也还远远没有达到人眼的程度。当然也有可能我做的不对,总是需要很多预处理,离自动化或者人工智能,还差的太远。

最近读文章注意到一点,就是有些人写一个新的神经网络结构的时候,用的词是'discover' -- we discovered such a structure。这个地方很有意思,一般来说,如果一个系统,一种方法是设计出来的,那么应该用we developed/designed such a structure,而不是discovered。比如,肯定不能说,we discovered computer, we discovered an algorithm, 对吧?什么样的东西需要discover 呢?自然界的东西,你原先不知道他的存在,而且你不知道他怎么work,才需要discover。比如,we discovered DNA, we discovered black hole。做出一个神经网络的时候,用的是discovered,就足以说明,作者并不知道它是怎么work的。只不过碰巧这么一种结构就work。从这一点上来看,深度学习现在还是一个黑箱,并没有人真正理解其意义,也无从谈起利用其实现人工智能。

《人民日报》前不久发表了一篇社论,题目叫做《思考的尊严只属于人类》。这是我少有的赞同的一篇社论。下篇写一下我在这方面的一些看法:人的生理需求与智能的不可分割性。


注:前几天没能出去,昨天到院子里一看,竟然已经误过了桃花的花期。连梨花都开到了鼎盛,整个小区一片片白色,如入仙境,一副‘千树万树梨花开’的景象。

Monday, April 11, 2016

人工智能有多远(1)--AlphaGO的‘智能’



我们这个年龄段的人不少都应该熟悉上面这幅画。这幅画来自于日本著名的漫画,和同名改变的动画片《棋魂》(ヒカルの碁)。这部动画片曾经风靡全球,今天在Amazon上搜Hikaru no Go还能见到不少相关的海报。《棋魂》播出的时候,曾经掀起过一股青少年学习围棋的热潮。

最近,据说韩国再次掀起了一股学习围棋的热潮,一时间有上万人报名。这次的原因很特别,是AlphaGO和李世石之间的人机大战。

李世石这个人,在围棋界算得上是神一样的存在。他20岁左右的时候,曾经以三段的身份,下赢了当年如日中天,排名第一的李昌镐。这个事迹,就好比爱因斯坦在专利局造出了相对论一样,不仅仅是惊人的,更是一种对体制的羞辱。李世石当年认为段位毫无意义,拒绝升段,导致韩国棋院为他打造了新规矩,让他在三个月内升到了九段。这就是人们常说的,牛人是不按规矩出牌的,而规矩反倒要为牛人来修订。

AlphaGO大胜如此一个神人之后,出现了两种观点。一种观点是这是Google和李世石合演的一场戏。我不认同这个观点。众所周知,自古以来,Google确实属于演技派。但是李世石是年轻气盛的一类,不可能为了其他的什么样的利益来损害自己的名誉。另一种观点则担忧机器马上就要超越人类,而人类就要为机器所控。这个观点我也不认同。

Google此次选择围棋来给自己打广告,既聪明又有误导性。当然,有些人没有意识到这是Google的广告,本身就是脑力不够的表现。这里我简单解释一下。现代社会,特别是美国,已经渐渐从政治统治变成了公司之间的竞争。像Google这种公司,不仅仅是富可敌国,而是本身就是一个独立的国家,有领土的概念,也就有扩张的欲望。

Google的广告就成功在围棋是一种很有迷惑性的脑力活动,因为棋盘大,搜索空间大,会让人误以为没有既定的规律可解。所以就会有这么一句话,叫做“酒量与棋力是天生的”,意思就是脑子不行,再怎么练也是不行的。我中学时在北京某所重点中学。我们学校初一入学的时候,有个小姑娘靠围棋业余五段的特长入校。后来她又下了六年,高中毕业的时候还是业余五段高考加了分。这个例子貌似就可以证明,棋力到了一定程度就提高不上去了。

对人来说,围棋的确是一种脑力活动。学过心理学101的同学都知道,人用来短期记忆的区域叫做海马体。老年痴呆症最初的表现就是海马体萎缩。即使在正常人中,海马体存储量也非常有限,一般只能记住7个单位。比如念出来一串数字,让另一个人重复出来的极限是7位,聪明一点儿的最多8,9位。有些人或许会说自己能记住超过10位。这是因为已经对10位以上的数进行了简化,联想,或者是编码。海马体及其有限的存储量决定了人在围棋的搜索区域一般也只有7步左右。初学下棋的同学应该有这种体会,当你试图往下多想几步的时候,往往会忘掉前面的步数。这时候就需要想像力,创造力,对整体的掌握以及艺术化的操作来取胜。正因为如此,对人类来说,围棋自古以来就是智慧的象征。

对机器来说,围棋却只是一种毫无想像力的机械计算。Google此次迎战李世石的硬件,据说计算能力相当于DeepBlue的几十万倍,虽然不足以对棋盘进行exhaustive search,但是瓶颈必然不在可以记住的步数,也肯定用不上任何的想像力或者创造力。用几千台机器全力跟单个人比,本来就没有任何可比性。此次Google用的是深度学习,如果我理解不是太错的,那就是局部pattern的匹配(关于深度学习,下一篇再讲)。这个做法,如果给予足够的时间,足够的人力,人是完全可以做得更好的,其实也就失去了以围棋来评价脑力的意义。




Tuesday, April 5, 2016

清明忆祖父

前两天听到5岁娃和3岁娃谈生死。5岁娃对3岁娃说,奶奶会先死,然后妈妈会死,然后我们会死。说到这里,夸张的两眼一翻,倒在床上。3岁娃睁大了眼睛,无限惊奇地说“Then there will be no one in our house”。5岁娃安慰她说,没关系,你的baby和你baby的baby就长大了。我在旁听了,不禁一笑。在孩子们的眼中,生死都是如此轻松的事情。联想到父母以前常给我讲的一个我小时的故事,说我4岁的时候,曾经抱着爷爷,问,爷爷,你这么老,什么时候死啊?爷爷大笑,回答我说,哎呦,我也不知道啊。

我的爷爷,在我印象中,始终是那么一个充满了生活的幽默和智慧的人。他睡觉的床离灯的开关很远,于是他做了一根长杆,用来‘遥控’电灯。爷爷手很巧,擅长木工。以前来北京,给我们打过一些家具。他曾经养了几十头猪,带我去看的时候,嘱咐我,千万别说杀猪,不然猪就不吃食了。爷爷是个象棋高手,跟我玩儿的时候总是让一两个子。赢了之后嘿嘿一笑,负着手踱出门去。爷爷曾经说一句话“人笨没药医”,大概是他太聪明了吧。

我最后一次见爷爷,想想已经是11年前的事情了。那时候爷爷还是很结实的,脑子也清楚。跟我下了几盘棋,盘盘都是秒杀我。后来要回北京了,爷爷说要送我,骑了一辆电动自行车,让我坐在车后。他让我抱着他的腰。那是我最后一次和爷爷距离那么近。爷爷是个光头。我在车后,看到他的头顶一块块的大白斑像地图似的。想到,这就是人老了吧。突然闪过一个念头,我还会不会再回来,我还会不会再见到爷爷。而有的时候,人的一闪念,可恨,会是那么的有预见性。

6年前爷爷去世,我是有预感的,因为他已经病了好久。我不敢问怎么样,总是偷着查爸爸的邮件,想要知道怎样了,又怕看到不好的消息。9月份的时候看到姑姑给爸爸的邮件,说爷爷每顿还能吃一碗饭,高兴的直哭。泪水里也有心疼。这人,真是无奈的人生,不论以前怎样,为什么到最后总是要受许多痛苦?几个月后有几天连着头痛欲裂,心里觉得不详。 又偷查了爸爸的邮件。果然有不幸的消息,忍不住在厕所里痛哭。我二十多年前问的那个生死问题,难道这就是答案么?我是深信鬼神的,深信这一切都是爷爷远隔重洋告诉我他要走了。我也总觉得爷爷去后常在天上护佑。可为何,这么多年来从不曾入梦?

后来听说爷爷直到去世的最后一天都是清醒的。去世三天前曾对奶奶说自己大限已到。最后一天早上刷牙的时候胳膊抬不起来,气地摔掉牙刷,说“不刷了”。想不到那天就是最后一天。

家里几位祖辈,外婆遗传病,四十出头就没了,我从没有见过。这几年爷爷,外公又相继离开。世上的亲人每少一个,就会觉得越发孤独无助,不知道怎样才能坚强,怎样才能活下去,不知道没有他们在背后怎样去面对那些不想见到的人和事。当然我有家,总是有依靠,只是更大的那个家里我很需要的有些人不在了。妈妈总是安慰我也安慰她自己,说只要不见到最后一面,那个人就对我们来说就还是活着的。我也渐渐相信,生死之间并非两界,只是他们看不到我们,我们看不到他们,就好像自地球两边。

有句话说,每个人都会死两次,一次是断气的时候,一次是被世人遗忘的时候。我想,这也是我活着的意义,爷爷也活在我的记忆里。

Sunday, April 3, 2016

记雪中赏梅




"梅须逊雪三分白,雪却输梅一段香。"

四年前我们搬新家的时候,我就亲手在墙角种下这棵梅树,从此一直等着“墙角数枝梅,临寒独自开”的景象。刚种下的时候只是光秃秃的一根树干。俗话说“桃三李四梅九年”。一起种下的几棵树前几年都开花结果了。唯独这株梅树,徒长了许多枝条。年初时,家里人都商量着要砍掉这棵树。我不肯,惊于人之无情。三月底的一天,突然发现梅树上挂满了成百上千的花骨朵,又是欣喜,又是心疼。这样好的一株树,竟然差点儿被砍掉。

雪中赏梅,自古以来为文人墨客所好。自那时起我便盼着下雪。昨天倒春寒,下了一场雪。此时正值梅花盛开。雪之冷与花之妍并存,的确是早春非常少见的景象。一团团雪落压在梅花上。梅枝簌簌发抖,梅花晶莹带泪。不禁惊叹于雪之纯粹,梅之风骨,自然之奥妙。此景令人见之忘俗,愿也溶于梅雪之中。

我家的别的花,梨花,海棠,棠棣,还要等上一个月天全暖了才会盛开。因此也理解了为何古人总赞梅与菊。宋朝时候有个叫林逋的,一辈子独居,以梅为妻,以鹤作子,就是“梅妻鹤子”的来历。我也羡慕那样的隐居,不必为凡俗所扰。蒋公之时,梅花也曾经是国花。如此瘦弱的身影,单薄的花瓣,与极不相称的冷风中绽放的勇气,令人感触,钦佩又怜惜。

今日雪过天晴,枝上的花只剩下零星几点,地上也早已不见,终究是逃不过“零落成泥碾作尘”的命运。如此添了许许多多的无奈。