也谈人工智能--AI科普入门


1. 科普入门

入门参考资料:

【硬核科普】一次看懂人工智能

人工智能概述

机器学习入门指南

人工智能的定义

人工智能(Artificial intelligence,AI)是指由人制造出来的机器所表现出来的智能。通常人工智能是指通过普通计算机程序来呈现人类智能的技术,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

人工智能是一个构建能够推理、学习和行动的计算机和机器的科学领域,这种推理、学习和行动通常需要人类智力,或者涉及超出人类分析能力的数据规模。

AI 是一个广博的领域,涵盖许多不同的学科,包括计算机科学、数据分析和统计、硬件和软件工程、语言学、神经学,甚至哲学和心理学。

在业务使用的操作层面上,AI 是一组主要基于机器学习和深度学习的技术,用于数据分析、预测、对象分类、自然语言处理、推荐、智能数据检索等等。

概况来说,人工智能利用计算机和机器,模仿人类思维的问题解决和决策制定能力。

人工智能的发展可以追溯到20世纪50年代,当时学者们开始探讨机器学习、模式识别和计算机模拟人类智能的理论。以下是一些主要的人工智能进展:

- 1956年:达特茅斯会议标志着人工智能研究作为一个学科正式成立。

- 1980年代末到1990年代初:神经网络的发展,特别是卷积神经网络(CNN),为图像识别和计算机视觉带来了突破性进展。

- 2004年:IBM的深蓝系统在国际象棋比赛中击败了世界冠军加里·卡斯帕罗夫。这标志着人工智能从博弈论应用到通用计算领域的一次重大跨越。

- 2010年代早期:深度学习和机器学习技术的发展,特别是Google的AlphaGo(围棋AI)战胜人类职业选手、谷歌翻译使用神经网络模型等,进一步推动了这一领域的进步。

- 自然语言处理(NLP)的研究也在持续发展,包括机器翻译、情感分析、自动摘要生成等领域。

未来,人工智能将在许多领域继续发挥重要作用,如自动驾驶车辆、智能家居系统以及医疗保健中的诊断和治疗。随着技术的成熟和成本的降低,这些应用越来越接近实际部署。

1950年:阿兰图灵发表了《计算机器与智能》一文,在这篇文章中他提出了“机器能思考吗?”这一问题,并介绍了图灵测试,用于确定计算机能否展示出与人类相同的智慧(或相同智慧产生的结果)。自此以后,人们就图灵测试的价值一直争论不休。

1956年:约翰·麦卡锡在达特茅斯学院的人工智能会议上创造了“人工智能”(AI)一词。麦卡锡后来又发明了Lisp语言。同年晚些时候,艾伦·纽厄尔、J.C.肖夫和海默·辛普森创建了有史以来第一个运行AI软件程序的机器“Herbert Simon”。

1967年:弗兰克罗森布拉特构建了Mark 1 Perceptron(基于神经网络的第一台计算机),它通过试错法不断学习。就在一年后,马文·明斯基和塞缪尔·帕普尔出版了一本名为《感知器》的书籍,这本书成为神经网络领域的标志性作品,并且至少在一段时间内是反对未来神经网络研究项目的论据。

20世纪80年代:使用反向传播算法训练自己的神经网络在AI应用中广泛使用。

1997年:IBM的深蓝计算机在国际象棋比赛中击败了国际象棋世界冠军格里厄尔·卡斯帕罗夫。

2011年:IBM沃森在《Jeopardy!》挑战赛中击败了肯詹宁斯和布拉德·瑞特。

2015年:百度的Minwa超级计算机使用一种称为卷积神经网络的特殊深度神经网络来识别图像并进行分类,其准确率高于一般的人类。考虑到随着游戏的进行,可能的走法非常之多,这一胜利具有重要意义(仅走了四步之后走法就超过14.5万亿种)。

2016年:由深度神经网络支持的DeepMind的AlphaGo程序在五轮比赛中击败了围棋世界冠军李世石。考虑到随着游戏的进行,可能的走法非常之多,这一胜利具有重要意义(仅走了四步之后走法就超过14.5万亿种)。

自诞生至今已有60多年发展历史,目前处于爆发期,经历过两次寒冬期:第一次因为算力不足;第二次因为硬件市场崩溃、资金不足、研究迷茫。

产业架构分为基础层、行业数据、软件设施和技术层等几个层级。

在基础层,主要包括通用数据服务以及面向大众的开源数据集平台。数据服务涵盖各种类型的开源数据资源,支持用户自由分享这些数据以供研究使用或开发应用。同时,这个层级还提供了面向企业内部用户的非共享性的行业数据源。

软件设施部分包括云计算平台和大数据平台,为系统的高效运行提供支撑。

技术层主要涉及开发框架,如TensorFlow、PyTorch、Caffe等机器学习工具,以及用于处理高维度复杂数据的深度学习模型。同时,还有计算机视觉、自然语言处理、智能语音和知识图谱等相关技术组件。

应用层则涵盖了人工智能产品的具体实现,如智能音箱、自动驾驶汽车、智能机器人、人脸支付等应用场景。这些产品都是基于上述的技术框架构建而成,在实际应用中发挥着重要的作用。

通过这个架构,我们可以清晰地看到人工智能的发展路径是从基础的数据服务到复杂的应用开发,再到具体的实用场景。

系统架构

典型的AI系统架构图如下:

为了简化阅读体验并确保信息的完整性,我将对这段文字进行拆分,并在每个段落开头添加小标题。以下是修改后的文本:

---

后续针对该部分单独介绍,此处不做赘述。

人工智能标准体系

人工智能标准化白皮书(2021版).pdf

- **第64页开始有部分案例介绍**

- 在这里详细阐述AI标准体系建设中的典型案例和应用实践。

---

请注意,上述内容是根据原始文本进行的拆分处理,并未对原文进行任何修改。如果您需要更详细的解释或具有特定结构的文档,请告知我。

AIGC算力时代系列报告

- ChatGPT研究框架.pdf

- AIGC白皮书(2022年)

- 典型案例:ChatGPT

参数数量和训练数据:

1. GPT-1:11.2亿BookCorpus

2. GPT-2:15亿WebText

3. GPT-3:1750亿

语料库内容:

1. BookCorpus(书籍)

- 未出版书籍,涵盖不同文学流派和主题,共4.5GB。

2. WebText(网页)

- 收集自Reddit上的投票最高网页,包含各种主题和来源,约40GB。

3. GPT-3语料库

- 总大小为570 GB,主要来自CommonCrawl、WebText等。

如何快速体验ChatGPT:

1. 通过微软新必应浏览器访问

人工智能研发运营体系(MLops)实践指南:

信通院