人工智能神经网络 人工智能不再是科幻小说

人工智能(一)机器学习和神经网络。在人工智能的发展中,人工智能会像人一样独立思考吗?我们如何让机器完成独立思考?

前段时间,我向您介绍了将创造未来的新技术,并讨论了5G和人工智能。一个孩子对我说:他对人工智能特别感兴趣。小时候,他特别喜欢看电影《终结者》和《机械敌》,但他仍然不明白:

为什么机器会像人一样思考?

“机器公共敌人”的遗迹

实际上,人工智能不再是科幻小说,它已被应用到我们生活的各个方面。例如,为了应对新的王冠流行,许多公司都安装了人脸识别系统。在筛查肺炎时,他们需要快速诊断肺部CT图像。如果您在道路上行驶时违反规定,将被电子眼睛罚款...在此,面部识别,CT人工智能用于图像识别和车牌识别。此外,各种语音助手软件,智能扬声器,美容软件,短视频平台推荐机制以及手机上的电子邮件反垃圾邮件系统也是人工智能的应用。人工智能在我们未来想要实现的领域,例如自动驾驶和智能产业中也是必不可少的。如果将人工智能从我们的生活中剥夺,人类可能必须追溯到三十年前。

今天,让我们谈谈人工智能的话题。我希望通过今天的解释,每个人都可以理解人工智能和神经网络的基本工作原理。

1、人工智能的历史

人工智能不是一个新的科学概念。在远古时代,东方和西方文明都出现了人造人类的神话。在1930年代和1950年代,由于神经生物学,计算机科学,数学和其他学科的发展,人工智能首次进入了科学家的视野。

1950年,英国计算机科学家图灵提出了一个问题:

机器会思考吗?

艾伦·图灵

Turing提出了一种测试机器智能的标准-Turing测试:一个人C通过一系列问题与另一个人A和计算机B进行通信,他是否可以通过一系列问题来区分A和B?人,这是一台电脑?如果人类无法区分A与B,则表示计算机已通过Turing测试。

图灵的预言:到2000年,经过五分钟的询问,计算机将愚弄30%的人,并使人们相信另一个人是真实的人,而不是计算机。图灵考试每年举行一次。 2014年,终于有了一款人工智能软件,被33%的人认为是通过图灵测试的13岁男孩。该软件称为Eugene Gustman。

Eugene Gustman

顺便说一句人工智能神经网络,计算机科学领域的全球最高奖项称为图灵奖,该奖以图灵命名。它被称为计算机界的诺贝尔奖。在第二次世界大战期间,图灵曾经帮助英国制造计算机来解密德国代码。许多人认为他是盟军赢得战争的法宝之一。这个故事也被拍摄到电影《模仿游戏》中。

“模仿游戏”的剧照

1956年,美国计算机科学家马文·明斯基,约翰·麦卡锡和信息论的创始人香农召开了达特茅斯会议。在这次会议上,人们创造了人工智能一词。自那次会议以来,人工智能也进入了一个巨大发展的时代。

在达特茅斯会议上,您可以认出几位伟大的神灵?

后来,明斯基和麦卡锡都因在人工智能领域的贡献而获得了图灵奖。香农不再需要图灵奖。他的名字以诺贝尔传播理论奖(香农奖)的名字命名。

人工智能神经网络 人工智能不再是科幻小说-

Marvin Minsky,John McCarthy和Shannon岁时的照片

在随后的几十年中,由于算法和计算能力的限制,人工智能经历了起伏不定。直到1997年,IBM的人工智能程序“深蓝”击败了在国际象棋领域已经统治了12年的卡斯帕罗夫,而人工智能又迎来了第三次重大发展。

Kasparov和深蓝色

从那时起的20年中,人工智能算法中出现了许多灵魂,例如多伦多大学的计算机科学家杰弗里·欣顿(Jeffrey Hinton),他是深度学习之父。他将反向传播算法(BP)引入了人工智能领域。纽约大学的计算机科学家Yang Likun以其在卷积神经网络(CNN)方面的工作而闻名。他们两个与加拿大蒙特利尔大学的计算机科学家Joshua Bengio一起获得了2018年的图灵奖。

杨立坤,辛敦,本吉欧

通过许多科学家的努力,在图像识别等特定领域,人工智能的识别率已经超过了人类。在语音识别和智能翻译领域,人工智能也有大量应用。现在我们已经在线,当我们遇到不了解的外语时,可以通过单击翻译将其翻译成中文。出国旅行时,双方还可以使用人工智能软件相互通信。

2、损失函数

计算机究竟如何做到这一点?毕竟,这是一个数学问题。让我们先举一个例子:

如何预测房屋的交易价格?

也许我们每个人都有一个简单的判断:大城市比小城市的房屋还值钱,城市房屋比郊区的房子值钱,学区的房子比非学区的房子要钱...那么,可以用数学术语表达吗?

例如:在最简单的模型中,我们认为房屋价格与面积有关。我们有一些房屋的面积及其交易价格,并在地图上绘制数据(xi,yi),如下所示:

从图形的角度来看,我们发现房屋价格和面积接近正相关。我们希望获得一个函数关系,以使其尽可能准确地显示出房价y与面积x之间的关系。最简单的关系是直线y pre = wx + b。其中w是直线的斜率,b是直线的截距。参数w和b的值不同,这条直线可以改变其在平面中的位置。

我们希望每个数据点都可以在一条直线上,但是实际上,这通常是不可能的。通过函数关系,预测的房价yi与实际的房价yi之间始终存在差异。我们使用损失函数来描述这种差异:预先制作每个数据点的实际价格y与输出价格y之间的差异,然后将这些差异作为平方和。

如果损失函数非常小,则意味着我们的函数与实际数据最接近。这是一个很好的回归分析。我们的目标是找到合适的参数w和b以最小化误差函数J。在数学上,这称为最小二乘法。在高斯和勒让德时代,人们找到了一种通过方程式求解参数w和b的方法。

Gauss和Legendre

但是,如果参数太多,那么高斯方程算法就不那么方便了。人们提出了一种渐进的渐近下降算法。通过重复逼近,发现一个小的损失函数和最优参数。

更具体地说:损失函数J实际上是参数w和b的函数。我们用参数定性地画出损失函数的变化规律,它可能有一个最低点,我们希望找到这个最低点。

大家看看:当参数设置为适当的值并且损失函数最小时,损失函数不会随参数变化,或者损失函数对该参数的梯度(导数)为零;如果参数选择不正确,则损失函数会随着参数的变化而变化,并且梯度(导数)不为零。而且,梯度(导数)越大,离损失函数的最低点越远。

因此,我们首先预设一对参数wi和bi,然后使用该算法进行迭代:

在这里,η表示步长,这意味着我们要在一次迭代中更改参数的数量。使用此迭代方程式,我们可以逐步找到最佳参数,这就是我们可以逐步进行的距离。我们沿着误差函数一点一点地搜索,然后我们可以缓慢地找到该误差函数的最小点。此时,参数w和b是最优解,它是代表房价与面积之间关系的最佳直线。

当然,房屋的价格不仅取决于大小。我们可能有更多输入数据。例如,每个房屋都有一个面积参数x 1、城市参数x 2、房屋年龄x 3、位置参数x4,那么我们可以假设价格是这四个参数的线性组合:

这时,我们有5个参数k1 ... k4和b。我们要做的是通过求解梯度来不断调整参数,找到最合适的组,并使预测结果与已知数据匹配。之间的误差函数最小。刚才,我们正在寻找二维平面上损失函数的最小值。目前,我们正在寻找五维空间中损失函数的最小值。

找到损失函数的最小值

输入数据,执行计算和调整参数。此过程称为机器学习或培训。如果最终找到或采用了最佳解决方案,则培训结束。如果未找到,则需要调整参数和模型。实际上,这与人类的学习过程非常相似。皮亚杰在认知发展理论中的同化和适应理论就是这样一个过程。俗话说,这也是一个问题。只是现在我们已经使用数学来表达它。

3、神经网络

从本质上讲,人工智能的问题是找到一种函数,该函数可以通过这种逐步调整参数的方法从输入值中尽可能准确地获取输出值。实际的机器学习问题比前面的示例复杂得多。例如,房价不仅与区域的大小有关,而且还与距市中心的距离,房屋的长度,楼层的高度,房屋的高度,周围环境的状况有关。工厂,学校和医院的汇率,甚至人口。诸如结构之类的因素是相关的,并且这种关系很可能不是线性的。在图像识别问题中,图片具有数百万个像素,即数百万个输入参数。

为了解决这些复杂的问题,科学家设计了神经网络算法。当您在Internet上搜索诸如人工智能,机器学习和深度学习之类的关键字时,您可能经常会看到这张图片。这是一个神经网络。在图片中,每个圆圈称为神经元。

单层神经网络

神经网络的创建源于人类对生物大脑的理解。人脑中有数百亿个神经元细胞。每个神经元细胞的前面都有树突来接收信号。当树突受到刺激时,神经元将判断刺激的大小。如果刺激足够大,神经元将决定神经递质或电信号通过突触将信号传递到下一级的方法。

1943年,美国神经科学家沃尔特·皮茨(Walter Pitts)和沃伦·麦卡洛克(Warren McCulloch)(沃伦·斯特吉斯·麦卡洛克)(Warren Sturgis McCulloch)分析了人类神经元的结构,他们提出:人类大脑的神经元是一个多输入,单输出系统,输出只有两种类型:0或1。如果输出为0,则表示上层神经元不会将信号传输到下一层。如果输出为1,则表示上一级神经元将信号传输到下一级。该计算机可以模拟人的大脑,这就是所谓的人工神经网络。

Pitts和McCulloch

他们提出了最早的人工神经元模型

-M-P模型。

此模型的运行过程为:

1、给定输入参数x1——xn,将它们线性组合以获得函数值y

2、将函数值y放入非线性激活函数中,以获得介于0和1之间的值f(y)。常用的激活函数称为S形函数,其表达式和图像如下所示:

Sigmoid函数

通过3、获得的激活值越小,将信号传输到较低水平的可能性越低;激活值越大,将信号传输到较低级别的可能性越大。

通过这样做,我们可以将一堆输入数字转换为0或1输出。只要选择的参数合适,我们就可以让计算机帮助我们做一些正确和错误的问题。例如,如果我们将图片发送到计算机,则这是一个25像素的纯黑白图像。我们希望计算机确定图像是否代表字母X。

计算机无法像我们一样一眼看到图像的内容,它只能识别数字。该图片有25个像素,每个像素为黑色或白色,相当于25个输入,每个输入为0或1。因此,此图片是计算机的5 * 5数字矩阵。

人工智能神经网络 人工智能不再是科幻小说-

如果是灰度图像或彩色图像怎么办?灰度图像中的每个像素都可以用0-255之间的数字表示,该数字等效于8位二进制数。如果是彩色图像,则每个像素都需要用RGB三种颜色的饱和度表示,数据量已扩展了三倍...但是无论如何,从计算机的角度来看,任何图片都只是一张一组数字,但数量或多或少。

计算机看到的世界就像Matrix电影中的场景一样

将由图片表示的数字输入到神经网络的输入层,数据依次流经隐藏层,然后传递到输出层。只有两个可能的输出值:0或1。输出0表示计算机认为它不是X,输出1表示计算机认为它是X,从而完成了机器识别过程。

在培训过程中,我们向系统中输入了许多图片,并告诉计算机正确的结论,以便计算机可以找到误差函数-该误差函数与刚才的预测房屋价格的函数不同,但原理是相似:模型与现实越接近,误差函数就越小。通过梯度下降法,计算机将一次又一次地调整参数,不断减小误差函数,最终得到一组最优解。此时,培训已完成。以后,如果您给我一张照片,我可以告诉您这封信是否是X。

如果您仅判断图片是否为X,那么一层神经元就足够了。但是,实际上,当我们使用人工智能翻译文章时人工智能神经网络,我们需要知道成千上万个单词或单词,理解语法并判断含义。仅凭一层神经元,它就无法处理现实世界中的此类复杂问题。实际上,人脑中有许多神经元层,每一层神经元都有多个神经细胞,因此人工智能也模仿了这种结构,并建立了一个多层(深层)神经网络。

单层神经网络和深层神经网络

多层神经网络的隐藏层是多层神经元。每层中都有许多神经元。两个相邻层中的神经元之间存在连接,因此该神经网络也称为完全连接网络,它可以处理更复杂的问题,因此机器可以像人类一样思考国家,家庭,社会和花卉,月亮和秋天的芬芳。

但是,完全连接的网络的最大问题是它们太复杂了。例如,如果您仍然判断图片是否是X的问题,则有25个输入参数。假设隐藏层有3层,每层有25个神经元,则大约需要优化2000个参数。请注意,这仍然是只有25个像素的简单黑白图片。实际上,每个图像都有数千个像素和RGB的三种颜色。在实际的训练中,需要大量的图像进行训练。在以前的计算能力下,几乎不可能完成任务。这也是人工智能之前陷入低谷的原因之一。

稍后,Hinton引入了反向传播算法,这意味着:在优化过程中,您无需同时优化所有参数,只要先考虑最后一层的参数,然后查看这些参数即可。优化后的上一层。 ,所以重复训练。他的工作意识到,图像使人工智能进入了第三波热潮。

4、人工智能框架

很明显,人工智能算法是如此复杂,以至于程序员不可能每次都从头进行编辑。就像厨师不能从种蔬菜开始,工人不能通过烧砖开始建造房屋。一些基本代码和逻辑应该已被编辑,可以直接调用。这就是所谓的人工智能框架。

近年来,由于人工智能的火爆,许多公司都开发了自己的人工智能框架。最受欢迎的是Google开发的TensorFlow,Facebook开发的PyTorch等。在人工智能时代开发框架就像在移动互联网领域开发通信标准一样。它将具有基本的和全行业的战略优势。

随着中国计算机和互联网技术的发展,对人工智能的需求也在增长。因此,华为还开发了自己的开源人工智能框架:MindSpore,它是华为Ascend AI解决方案的一部分。

它的主要特点是:

01自动并行。通过声明,MindSpore将帮助您完成分布式并行功能。现有的大多数框架都要求数据工程师手动编写分布式和并行策略。

02更快的参数优化。在优化参数时,传统的梯度下降算法是一阶优化,等效于以恒定速度查找目标。 MindSpore可以实现二阶优化,这相当于加快了对目标的发现。在某些情况下,与传统算法相比,训练时间可以缩短20%以上。

03在所有方案中的云,边缘和端到端协作。也就是说,使用MindSpore框架开发的程序可以用于云计算中心,智能终端(例如手机和电视),也可以用于边缘区域(例如自动驾驶汽车)。例如,在手机上打字时,人工智能可以实现自动纠错和关联,而在自动驾驶时,人工智能可以对信号进行实时判断。这些不需要每次都发送回云计算中心。

04更好的信息安全性。 MindSpore可以实现信息脱敏,即将加密信息上传到云中进行培训。数据和模型不敏感。即使其他人获得了数据,他们也不知道数据内容是什么。即使获得模型,我也不知道如何使用模型。这在诸如面部识别等具有安全要求的区域中非常有用。

华为还建立了类似于Github的代码社区MindSpore社区(),并与中国各地的大学联手鼓励大学师生使用MindSpore框架来构建自己的人工智能代码库。

MindSpore是一种全场景的AI计算框架,它是AI的根本技术之一,是AI技术的皇冠上的明珠。上层应用程序具有开发框架并不难,任何学生都可以开发应用程序。从开源框架到AI开发平台的产业化升级,这意味着华为全栈全场景的AI软硬件主干都已投入行业实践,成为全球AI开发者能力的一部分

【版权声明】本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 playplus@qq.com 举报,一经查实,本站将立刻删除。