首页 > 编程知识 正文

算法与AI算法,ai与算法

时间:2023-05-06 03:44:48 阅读:282345 作者:1010

目录 AI往期系列科普结论先行专家系统传统机器学习样本特征理解总结

AI往期系列科普

AI科普(一):什么是人工智能?
AI科普(二):人工智能的根本任务
AI科普(四):通俗易懂的机器学习模型

结论先行

我们知道AI的应用场景是十分广泛的,所有这些问题归根结底都可分为分类问题或者回归问题,而最终计算机解决这些问题的方案,我们称之为算法。

常用的算法类型有专家系统、传统机器学习与深度学习。专家系统通俗来说就是制定规则;传统的机器学习主要运用可解释的数学公式进行推导预测;而目前大火的深度学习则是模拟人脑神经元进行学习与预测,通常不具有可解释性,但却能很好的解决问题(之后会专篇介绍)。

专家系统

专家系统通俗的说就是利用以往知识与经验制定规则。比如我们在AI科普(一)中介绍的垃圾邮件识别,我们会根据经验判断如果一篇文章中出现大量的“免费”“特价”“发财”“代理”“稳赢”等等关键词,我们就把它定义为垃圾邮件。

生活中的专家系统有目前常见的健身运动类app,我们在注册时它会要求你输入年龄、性别、身高、体重等基础信息,并在每时每刻检测你的活动量,然后后台就会直接套用卡路里公式计算你一天的消耗。

如上例参数(女性为例):655,9.6,1.9,4.7其实就是知识得出的经验值,可能是根据科学家科研得出的结果。同时测定每种运动每分钟所对应的活动量以及每种食物每克的热量,然后就可以根据你每天的输入与输出计算出每日是否减肥有效。这就是一个常见的专家系统。

传统机器学习

在植物界有一类花叫鸢尾花,我们可收集它花萼的长度与宽度,来判断它具体属于哪一品种。首先将花萼的长度与宽度绘制在一张二维图中,红色代表一类,蓝色代表一类:
这时,我们要做的就是根据两组数据计算出一条f(x)=k1x1+k2x2+b(可理解为y=kx+b)的直线将两类数据分离:
如果再来一组数据落入直线上方,就归属于红色类;若落入直线下方,则属于蓝色类。由于可视化与易推导的需求,我们通常将数据维度降到2维或3维来说明原理。而现实中的数据通常是具有多种特征的,比如鸢尾花的数据集原本有4个特征,其实我们应该在一个4维空间对数据进行切分。机器学习背后的数学保证了低维空间的算法推导到高维空间也同样适用。

样本特征理解

我们可以看到在鸢尾花分类任务中的特征都有明确的含义,每个数字代表什么意思。而其实在机器学习中,特征可以是很抽象的,在图像识别领域中,我们通常将每一个像素点看做一个特征。
在数字识别任务中,我们将图像放大,每一个像素由一个方块表示,方块颜色的深浅不同就对应着不同的值,所以我们可以用28*28=784个特征来代表这张图像,然后将数字按顺利排开喂给机器机进行学习,并归纳整理每个位置的值与最终结果的关系。在算法领域中特征可能是不具有含义的,而是抽象的,甚至我们觉得这个特征与最终结果毫无关系。

总结


在算法领域中有白盒算法与黑盒算法,白盒算法的推导预测过程拥有明确含义,比如上述鸢尾花分类问题,只要计算出直线的斜率(k)与截距(b),就可对样本进行分割。而黑盒算法很难解释我们得到的对应关系到底是什么意义,但是计算机学习到的这种对应关系确实可以帮我们解决问题得到结果。

本人为NLP算法工程师,更多AI科普系列请关注微信公众号:AI有温度

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。