机器学习之路

我的本职工作并不是机器学习,甚至连数据都没有太多的接触.我并没有大量的数据需要挖掘,更没有一个良好的模型需要模拟.我想要的仅仅市一个有趣的,可以给我无聊的工作带来一丝乐趣的AI.至少我是这么认为的.

机器学习的道路道阻且长.毕竟我的大学专业并不是这个,但是至少有接触过编程.其中python是我跟着廖雪峰老师自学的,虽说入门容易,但是精通难,我更多的只是了解了语言结构和一些常用的包,涉及更深则用不多,所以就没有深入.而对于此我并不觉得奇怪,至少我大学学过数据库之后,常用的语句也就那几个查询,删除,至于触发器.我学过,练习过,但是没有长久使用,还是在记忆中遗忘了.我对于现代社会的技能我更多的认为是,用的时候去学,保持一个快速学习的能力即可.更多的是需要你对一个系统或者语句的基础了解.当然这些只不过是能满足我目前的需求,实际涉及到底层的逻辑则就深不可测.而我也没有机会或者需求去处理那种问题.

实际上,哪怕你是去大厂内,这种高级的底层逻辑也被大神们打包好,你只需要调用即可.自己从从头梳理那几乎干不了啥事.所以我对于机器学习只是希望入个门,就像python一样,哪天想用,可以快速上手,做过一个简单的数据分析.

20220513233627

数据科学导论这本书是我在知乎上搜索数据科学之后,大神推荐阅读的.首先说结论:书有用,很有用,介绍了几个主流的机器学习算法,以及一整套的机器学习的流程:数据-清洗-切片-学习-验证-学习.所有的机器学习都是这么一个整体流程的.但是这本书毕竟是一本入门书籍,它也许不会要求你有很多的数学知识储备,事实上书上没有涉及到任何的数学公式.但这也正是这本书的不足之处.

读这本书的过程和结束有点像是在大学里面上的专业课.老师并不会或者简单的描述各个算法的背后逻辑,但是你自己却不甚明白,至少我用了一些我的自己日常数据进行测试,发现线性逻辑回归对我来说最好.大学的课程和这本书一样,都是一个简单的介绍入门,等到你进入社会或者以后有需要的时候,你就会深入的去了解每一个算法背后数学测算和原因.这就是这本书最大的作用,也是我读完这本书最大的观后感.读完感觉跟没读一样.跟着书中的代码编写,但是知道出现的结果一致,但是对中间的过程没有任何了解,也没有习题来加深或者拓展一下更加实际的场景应用.但恰如我所说的,它仅仅是一个入门,它激励着我去学习更多相关知识,至少目前是准备看中间算法的实现和对应机器学习包的参数设置.任重且道远啊.

机器学习

对于本书的阅读方式我建议是,看书加代码.代码可以自己跟着书敲,也可以主动看,这点没有差别.主要是为了看代码的一个写法,让你了解代码的一个结构.至于内容,如果是个新手,很多东西都是一个打包好的结果给你,你可以套用到你自己的现实数据,但是一般很少有如此恰好的数据模型给你,而且你不知道中间过程,你自己对此产生的结果也是没底的状态.不过用来查看数据的一些常用统计数据倒是很不错,也很快捷.

读书之后的问题:

机器学习之路问题