第6章 机器学习

【任务--完成一门编程语言高级教程的学习(100%),奖励:经验、积分、一次普通转盘奖励。】

经过昨晚的奋战和今天一天的努力。齐凡总算把这个任务完成了。

当他再次唤出面板时,完成任务的提示在他脑海响起。

【任务完成。计算机经验+8,积分+5。】

系统面板上的数据已经相应地发生了变化。

【AI系统:Lv0】

【计算机:Lv0(60/100)】

【数学:Lv0(12/100)】

【硬件:Lv0】

【积分:55】

-----------------

齐凡如今成了许阳学长这个课题组的非正式成员。

今天许阳他们挺顺利,没有再遇到什么奇奇怪怪的问题。齐凡帮他们改了些代码,这没花他多少时间,大多数时候他都在白嫖一旁空着的电脑,做他自己的事情。

实验楼里最不缺的就是电脑,而且还胜在完全免费。虽然学校也有机房开放,可是要收费的,只是价格比外面的网吧便宜而已。

“齐凡,辛苦你了。要不你先回吧,我们晚上还要继续奋战。”

“那我晚上陪你们好了,反正我也没啥事。”

张开在一旁打趣,“好吧。计算机学院一脉相承的没有夜生活。”

齐凡尴尬笑笑。他连个电脑还得想办法白嫖,哪有钱去谈什么恋爱。再说谈恋爱哪有学习好玩。

“对了,齐凡。你明天正式开学了吧。到时你先忙你的课程好了,你有空再过来帮我们。”许阳学长很贴心,不想因为他们的毕设耽误学弟的学业。

“好的,我知道了。学长,你们也忙了一天,要不先去吃晚饭吧。”

齐凡其实很好奇许阳他们三人搞的究竟是个什么东西,可白日里三人太忙,他也没好意思多问。此刻去吃晚饭的路上众人说说笑笑之间,齐凡就有意提起了他们在做的这个课题。

“学长,你们在弄的到底是个什么东西。”

“就是数字识别,白天的演示你也看过了。”

齐凡刚刚进来实验室的时候,倒确实特意要求看了下程序演示。

许阳在纸上写了一个数字,然后用手机拍下来,再通过数据线传入电脑,最后用那个程序读取图片识别手写的数字。

许阳演示的时候写的几个数字识别还挺准,轮到齐凡自告奋勇时,他写了一个歪歪扭扭上面狭长下面大的“8”。结果程序识别成了“6”。

这让许阳三人一阵尴尬。张开表示:齐凡这是在耍流氓,是逗弄计算机的无耻行为。

齐凡当然是有意为之,他这是出于技术直觉,在测试程序的“鲁棒性”。一个合格的程序,就该能处理得了极端情况。

所谓的“鲁棒性”,就是你再怎么撸我,我依然很棒棒的。

即便这个程序一眼看着就不够耐造,可好歹它还是能识别得出工整的数字。这对齐凡来说,是他的知识盲区,所以他很好奇。

“学长。我知道这系统的作用。那些代码的语法我都懂,可我就是看不懂整个程序工程的逻辑。不明白它识别数字的原理。”

许阳面上有些得意,倒不是因为他想装X。而是因为先前在自己学弟面前过于丢脸,此刻正好可以找回些颜面。

“这个嘛,就涉及到机器学习的领域了。你是学CS(计算机科学的简称)的,理论主要偏向于:操作系统、数据库、数据结构、微机原理、各类算法。”

“而我们呢,其实就是教计算机干活的。”

齐凡明白了,“你的意思是。我学的CS是造工具的,你们是拿工具来干活的?‘机器学习’其实就是让机器干活。”

“对对对,你这个比喻好。机器学习就是让机器学着干各种各样的活,它的领域是很广泛的,其中很大的一个应用场景就是视觉处理。也就是我们现在做的手写数字识别。”

“至于具体的原理嘛,现在对你来说肯定还过于深奥。你感兴趣的话,我可以借你几本书先看着。不过我要先提醒你,机器学习是门综合性很高的学科。你不要指望一个大一生看了几本书就会了。”

“写Python的话看个两本书就能动手了。可要涉足机器学习,你还得先懂微积分、线性代数、概率统计以及图像处理。你现在应该连线性代数都还没学完吧。”

齐凡听着这话。学长明明在找自己帮忙写Python,却说写Python看两本书就能动手了。看来对方虽然面上有些尴尬,可实则心里还是很骄傲的。心里头肯定觉得他正在整的机器学习才是更加高端的东西。

而对齐凡来说,对方越是要叫自己量力而行,那自己就越是满腹好奇。

吃晚饭时,三位学长除了聊毕设课题,就是聊未来的实习计划。齐凡作为一个大一生,完全插不上嘴。

无聊之下,齐凡边吃饭边扒手机。

“老齐,在几楼呐,我也来图书馆了。”舍友贾震在中午发的消息,过了足足半天之后齐凡才看到。

“我没去图书馆。”齐凡随手回复了句。

已经回到宿舍的贾震嘴边一抹嗤笑,“游戏玩得够嗨的呀,消息半天才回。”

“我没玩游戏。”齐凡秒回。

“【坏笑】【坏笑】”

齐凡看着贾震发来的表情包,随手就退出了聊天框,他此刻没心思和对方多唠嗑。

齐凡用手机白度“机器学习”。

尼玛,这搜索引擎真智障。把机器学习四个字理解成了“机器”和“学习”。

于是排在前头的不是卖机器的广告,就是学习辅导机构的广告。

齐凡努力往下翻,总算找到了些相关的内容。可细看之下都是些语焉不详不成体系的鸡零狗碎。

果然要查学习资料还是得靠谷哥。手机是别想了,好在学校内部网络是可以访问外网的。

回实验楼的路上,系统面板自己弹了出来。

【任务--入门机器学习(0%),奖励:经验、积分、一次普通转盘奖励。】

齐凡不由得一阵欣喜。他刚刚完成一个任务,还没来得及抽奖,这就立马又触发了一个任务。

他有种感觉,似乎自己接触到新知识,系统就会触发任务。

在任务奖励的激励下,齐凡对于机器学习的热情更加高涨。

一回到实验楼,齐凡就赶紧问许阳要书看。

许阳给了他一本西瓜书。

至于为什么那本书叫“西瓜书”,是因为封面上画了几块西瓜。其实这本书的名字就叫《机器学习》。

IT行业与别的行业不同。一些书的封面,还有软件的logo,就喜欢用一些动物还有水果。这和IT行业的精神有关--自由、开放、包容、反权威。

久而久之,大家也就习惯用封面或logo上的动物和水果,来当作对书本和软件的称呼。

比如:猫头鹰书、乌龟书、西瓜书、南瓜书等等。

“你要入门的话,先看这本就够了。但这本是讲通用理论的,不涉及机器视觉这个分支领域。你可以去图书馆找本数字图像处理作为补充,记得一定要留意作者名字--Gonzalez。因为那本最经典。”

“识别数字的原理。本质上就是从图像中提取特征,然后再分析特征做出判断。”

“虽然就这么简单一句话。可是这涵盖了图像处理和高数,还有计算机。总之涉及的东西太多了。我真的建议你读完大二再接触这块,至少那会儿大半的基础课程你已经学过了。”

“谢谢学长,我先看看。”

齐凡感谢了对方的善意提醒,随后找了个角落猫着翻看《机器学习》。

三分钟后。尼玛,果然看不懂。