Chat with Wiki - AI 图像识别的发展历程

Answer

AI 图像识别的发展历程如下：

早期处理印刷体图片的方法是将图片变成黑白、调整为固定尺寸，与数据库对比得出结论，但这种方法存在多种字体、拍摄角度等例外情况，且本质上是通过不断添加规则来解决问题，不可行。
神经网络专门处理未知规则的情况，如手写体识别。其发展得益于生物学研究的支持，并在数学上提供了方向。
CNN（卷积神经网络）的结构基于大脑中两类细胞的级联模型，在计算上更高效、快速，在自然语言处理和图像识别等应用中表现出色。
ImageNet 数据集变得越来越有名，为年度 DL 竞赛提供了基准，在短短七年内使获胜算法对图像中物体分类的准确率从 72%提高到 98%，超过人类平均能力，引领了 DL 革命，并开创了新数据集的先例。
2012 年以来，在 Deep Learning 理论和数据集的支持下，深度神经网络算法大爆发，如卷积神经网络（CNN）、递归神经网络（RNN）和长短期记忆网络（LSTM）等，每种都有不同特性。例如，递归神经网络是较高层神经元直接连接到较低层神经元；福岛邦彦创建的人工神经网络模型基于人脑中视觉的运作方式，架构基于初级视觉皮层中的简单细胞和复杂细胞，简单细胞检测局部特征，复杂细胞汇总信息。

Content generated by AI large model, please carefully verify (powered by aily)

References

如果识别一个印刷体图片，我可能会怎么做神经网络解决的是未知规则的处理。先把图片都变成黑白大小变成固定尺寸和数据库的东西对比得出结论然而，这种情况过于理想化。不仅存在多种字体，即使对于印刷体，不同的拍摄角度也引入了多种例外情况。虽然存在图形算法进行矫正，但整体方法仍然是基于不断添加规则。这种方法本质上是试图通过不断增加和完善规则来解决问题，这显然是不可行的。虽然这种方法可以解决象棋的问题，但对围棋来说就非常困难了。围棋的每个节点有三种可能状态：白、黑或空，加上不同节点间状态的组合，现有的资源无法应对。神经网络专门处理未知规则的情况。将图片转换为黑白，调整图片至固定尺寸，与数据库中的内容进行对比，最终得出结论。神经网络的发展得益于生物学研究的支持，并且在数学上提供了一种方向，使其能够处理未知的情况，如手写体识别。关于这部分内容，非常建议看《这就是ChatGPT》这本书，它的作者是被称为”在世的最聪明的人”，研究神经网络几十年，创作了Mathematica、Wolfram等备受推崇的软件，这本书最特别之处还在于，导读序是美团技术学院院长刘江老师回顾了整个AI技术发展的历史，对于了解AI，大语言模型计算路线的发展，起到提纲挈领的作用，非常值得一读。本文写作过程中得到了[byzer-llm](https://github.com/allwefantasy/byzer-llm)作者祝威廉的大力支持，在此感谢。byzer-llm选择了一个非常特别的技术路线，在大模型时代显得尤为重要。

机器之心的进化 / 理解 AI 驱动的软件 2.0 智能革命

CNN的结构是基于这两类细胞的级联模型，主要用于模式识别任务。它在计算上比大多数其他架构更有效、更快速，在许多应用中，包括自然语言处理和图像识别，已经被用来击败大多数其他算法。我们每次对大脑的工作机制的认知多一点，神经网络的算法和模型也会前进一步！

机器之心的进化 / 理解 AI 驱动的软件 2.0 智能革命

该数据集对研究人员非常有用，正因为如此，它变得越来越有名，为最重要的年度DL竞赛提供了基准。仅仅七年时间，ImageNet让获胜算法对图像中的物体进行分类的准确率从72%提高到了98%，超过了人类的平均能力。ImageNet成为DL革命的首选数据集，更确切地说，是由Hinton领导的AlexNet卷积神经网络（CNN - Convolution Neural Networks）的数据集。ImageNet不仅引领了DL的革命，也为其他数据集开创了先例。自其创建以来，数十种新的数据集被引入，数据更丰富，分类更精确。神经网络大爆发在Deep Learning理论和数据集的加持下，2012年以来深度神经网络算法开始大爆发，卷积神经网络（CNN）、递归神经网络（RNN - Recurrent Neural Network）和长短期记忆网络（LSTM - Long Short-Term Memory）等等，每一种都有不同的特性。例如，递归神经网络是较高层的神经元直接连接到较低层的神经元。来自日本的计算机研究员福岛邦彦（Kunihiko Fukushima）根据人脑中视觉的运作方式，创建了一个人工神经网络模型。该架构是基于人脑中两种类型的神经元细胞，称为简单细胞和复杂细胞。它们存在于初级视觉皮层中，是大脑中处理视觉信息的部分。简单细胞负责检测局部特征，如边缘；复杂细胞汇集了简单细胞在一个区域内产生的结果。例如，一个简单细胞可能检测到一个椅子的边缘，复杂细胞汇总信息产生结果，通知下一个更高层次的简单细胞，这样逐级识别得到完整结果。配图05：深度神经网络如何识别物体（TensorFlow）