close

杂记

考整理

教授学习的本质

study

在了解了一些人工智能的知识并阅读了一些相关文章之后,猛然意识到,其实人类学习的本质跟机器学习的本质存在着某种惊人的相似性,因此教授学习的过程也应遵循相应规律,整理思考,撰文记录

此文大量参考杨建国先生在知乎的回答以及其公众号内容

先说结论,毫无疑问学习的目的是让学习者在遇到新问题的时候能够利用所学知识解决。在这里,归纳学习本质的四个过程即是1.学习二阶知识 2.清洗信息 3.选定输入输出的例子作为训练集 4.使用例子作为验证集进行学习成果的验证。

而教授学习的本质具体是五个过程:1.描关并教授关于学习本质的四个过程 2.教授二阶知识 3.协助进行数据清洗,并教授关于数据清洗的知识 4.协助选定输入输出正确的例子作为训练集,用于进行知识的学习 5.通过例子作为验证集进行输出,验证对知识的学习成果。这五个过程在顺序上需要把1和2放在前面,在345的进行过程中不断重复1和2的内容。

下面来依次解释这五个过程。

描述并教授关于学习本质的四个过程

理论上来说,关于学习本质的四个过程是一种知识,而非一种信息,知识和信息的区别如下:

知识和信息的区别在于,知识对应的是理解与联系,而信息对应记忆,对于知识的描述是一种记忆而不是知识本身。

那可见仅仅教授知识的描述并不能真正传授知识,那为什么还要把这个过程放在最前面呢?原因有两点,其一是因为这离不开人类智能的特性:

人类智能的特性之一是:意识很难脱离自然语言进行思考,从某种程度来说,不提出某个概念的概括,人类是很难围绕这个概念进行意识活动的,可以理解为,若不构建这个概念,则人类几乎无法使用这个概念进行思考。

作者按:此处不免有一些民科……

因此,这里首先提出对于知识的描述,本质上是为了能够方便对于知识的结构化使用和验证。

原因的第二点在于,这5个步骤本身就是1归纳,5举例子,这个过程本身也符合学习的规律,即用知识的描述所对应的步骤例子,验证这个对于知识的描述,进而把对于知识的描述内化为知识本身。

教授二阶知识

二阶知识是指那些是“知识的知识”,是指关于“知识如何组合的知识”。

现实生活中的问题千变万化,每碰到一个问题都是全新的,如果解决这种问题的知识是一种全新的知识的话那学习就没有意义了——这意味着过去的知识不能适应新的问题。因此,利用有限所学的知识进行组合以解决近乎无限的问题才是学习知识的重要步骤,否则面对问题是无异于陷入泥沼。

以一个看似无从下手的问题为例:抖音每年平均的广告收入是多少?

获得该答案最直接的方式是拥有字节跳动公司内部的财务数据,但是这并不是是个容易的解决办法,显然公司的商业数据不可被轻易掌握。那是否无法解决,不是的。

这里提供一种可能的方式:广告收入=365天×日活×人均每天刷到的广告次数×平均每次广告呈现的费用,人均每天刷到的广告次数=人均每天的使用时长×平均刷多长时间出现一次广告。这里日活数据往往能够查到,人均每天使用时长也可以查到或者通过小规模调研可以测算,平均刷多长时间出现一次广告可以通过小规模调研测算,平均每次广告呈现的费用可以同字节跳动的销售了解。这样就能算出来