对于ai的建模来讲,我们最终的目的就是要构建出一个泛化能力非常强的模型,也就是适应能力非常强的模型,那泛化跟过拟合之间有什么区别呢?其实啊,从这个图里面可以看得到啊,其实为了构建泛化能力比较强的模型,那其中的一个点就是我要去避免模型的过拟合现象。所以这是他俩之间的一种一种区别,然后呢,除了过拟合之外呢,那为了构建一个泛化能力比较强的模型,那我们首先要选择一个正确的数据,因为数据不正确,那接下来建模肯定是构造不出一个泛化能力很强的模型的。
那第二点我们要选择一个合适的模型,因为不同的应用场景,或者不同的啊,这个应用它可能适合的模型是不一样的,比如说呃,我们图像识别,那比较适合的模型呢,叫做卷积神经网络,那我们做机器翻译,那比较适合的模型可能是像递归神经网络,我们举个例子,比如说我们要搭建一个评分卡系统,那对于评分卡系统来讲,那可能常用的模型啊,有像gbdt,或者这种类似的集成方式,所以每种不同的应用场景,其实通过已经通过很多的人的经验,已经总结出可能这个领域比较适合的模型有哪些。
那第三点呢,我们要选择合适的优化算法,因为优化算法本身也是对我建模之后的模型产生一定的影响的,比如说逻辑回归,那我们可以使用t摄像法,或者其他的算法也都是可以的,因为本身它比较简单,那假设我要训练一个深度神经网络。那深度神经网络训练的过程当中,我们可以使用像梯度现象法,或者是可以使用像elra算法,类似的方法论是很多的,所以这些我们把它统称为叫优化算法。所以越复杂的模型,我们在优化算法本身上可能还需要花更多的功夫来去选择。
比如说有些算,有些模型呢,它可能更适合用ara啊这种算法来去优化,那有些模型可能更适合用比如说算法来去优化,所以很多的时候我们需要做一个不同的尝试的,因为算法本身它会影响我最终的模型的一个结果。所以总结起来的话,那为了构建泛化能力比较强的模型,就是适应,适应能力非常强。然后呢,我们可能需要从这四个方面去考虑。所以数据。还有模型,还有算法,还有最重要的一点就是过拟合,我要去保证我们的模型就是不要去过拟合,就是避免过拟合现象,但是很多的时候,其实你我们没有办法100%去啊规避咱们这个过拟合现象的,所以我们能做的事情就是尽量的去减轻我们模型的过逆和现象,这是现实的一个工作当中,我们需要思考的一些几个点。