SlideShare a Scribd company logo
大数据/人工智能与未来
赵启方博士
大纲
• 身边的大数据:应用场景
• 大数据的前世今生
• 大数据的本质
• 大数据的未来
• 大数据与其他未来科技
• 大数据:如何从娃娃抓起
大数据就在身边:交流沟通
• 网页翻译
大数据就在身边:交流沟通
• 图片翻译
大数据就在身边:图片识别
• 邮编识别 • 车牌识别
• 超速
• 车库管理
大数据就在身边:购物,推荐系统
• 推荐系统
大数据就在身边:购物,淘宝同款
• 淘宝同款
大数据就在身边:娱乐
• 网易云音乐
• 每日推荐
• 专辑推荐
• 婚恋网站
• 推荐约会对象
• AI 红娘
大数据就在身边:
个人信用
• 芝麻信用
• 花呗
• 借呗
• 趣店:从校园贷到消费贷
• 小白信用
• 腾讯信用
大数据就在身边:打击犯罪
• 寻找失踪人口
• 搜捕罪犯
大数据就在身边:
医疗诊断
• 辅助诊断
• 分析 X 光片
• 根据大数据 (大量病例),
做出类似老医师的精确
诊断
大数据就在身边:
法律文书
• 寻找相似判例
• 代替低端律师工作
大数据就在身边:获取信息
• 搜索
• 百度
• Google
• 广告
• 百度
• Google (90%+ 利润)
• 脸书 (Facebook) (95%+ 利润)
• 魏则西事件
• 如果大数据用来作恶,...
大数据就在身边:
工业生产
• landing.ai & 吴恩达
• 图像识别
• 生产参数优化
大数据的前世
• 小数据
• 基本核心
• 数据
• 算法模型
• 应用��围狭窄
• 科学研究领域:心理学,统计学
大数据的今生
• 基本核心
• 数据
• 算法模型
• 高性能计算机
• 主要因素
• 计算机(网络)存储的数据量激增
• 计算机性能(CPU/GPU)激增
大数据的今生:热点
• 阿尔法狗
(Alpha Go)
大数据的今生:热点
剑桥分析 (Cambridge Analytica)
脸书 (Facebook)
英国脱欧
特朗普当选
大数据的今生:
热点
• 自动驾驶
• 汽车
• 高铁
大数据的实质:模拟人的判断
• 基本核心
• 数据
• 算法模型
• 高性能计算机
• 通俗事例
• 数据:是否外地人
• 模型:如果 ... 那么 ...
人员编号
是否外地
人
素质高低
1 是 低
2 是 低
3 是 低
4 是 高
5 否 低
6 否 低
7 否 高
8 否 高
9 否 高
人员编号 是否外地人 性别 毕业大学 公司 职业 ... 婚否 素质高低
1 是 男 北大 腾讯 工程师 ... 未婚 高
... ... ... ... ... ... ... ... ...
10,000,000 是 女 复旦 - 主妇 ... 已婚 高
大数据的实质:模拟人的判断
• 图像识别
• 识别人脸,车牌号等
• 自动驾驶
• 机器翻译
• 国外旅游生活
• 翻译影视字幕
• 语音识别
• 语音助手,如Siri
• 推荐系统
• 娱乐,如音乐App
• 购物,淘宝京东等
• ≈ 超级秘书
推荐系统原理:协同过滤
大数据/人工智能 (AI)/数据科学
• 基本核心
• 数据
• 算法模型
• 细微区别
数据量 数据类型 算法模型 工程实现
大数据 大 各种 不注重 注重
人工智能 大
文字,图片,
音频,视频等
注重,相对单一 注重
数据科学 大中小 各种
注重,各种算法
模型
视情况而定
大数据的未来:未来10-20年
• 基本工具,类似计算机
• 大部分人
• 理解大数据,会基本应用到自己的行业
• 小部分专业人员
• 提高 AI 的性能
• 发掘新的算法和应用场景
大数据的未来:与其他未来科技
• 大数据 / AI
• 量子计算机: 极大增强 AI
• 生物制药: AI 是最佳辅助工具
• 物联网: 为 AI 提供大量数据和应用场景
• 新能源: 极大拓展人类生存空间, 间接促进 AI 发展
大数据的未来:中国
• 优势
• 数据量大
• 人多 ≈ 14亿,美国的四倍
• 制造业产值和规模全球第一
• 政府支持
• 劣势(只是相对于美国)
• 人才短缺
• 制造业基础差
• 自动化,计算机化程度低
• 芯片行业受制于人
大数据的真正未来:强人工智能
• 量子计算机: 提供超强计算力
• 真正的上帝
大数据:从娃娃抓起
• 数学 / 统计
• 计算机 (编程)
• 理解大数据的思维
• 模拟人的判断
• 了解人的判断的优缺点,以 AI 来辅助人
大数据 / AI 的启示
• 理性思维
• 专注
• 一个AI只处理一类问题
• 不停的学习
• 不停的提供AI数据,AI能自动调整模型参数,做出更准确判断
• 采用新的模型

More Related Content

Big Data and Future

Editor's Notes

  1. 去国外旅游的时候查看菜单
  2. 如果大数据用来作恶,会有多少魏则西受害
  3. 之前说的大数据应用案例都是发生在我们身边,都是以个人为中心的
  4. 大数据已经和我们的生活密不可分
  5. 大数据确实可以推波助澜 作为压倒骆驼的最后一根稻草
  6. 用计算机模拟人的判断 通俗事例:外地人素质低
  7. 约等于超级秘书,比你妈还懂你。他了解你越多,就越懂你
  8. 因为芯片是计算机的核心。
  9. 有且仅有一个,基本掌握真正的真理 与人类共存
  10. 这三点就是基础。从小的时候就要好好学习数学和计算机编程。到大学,再去理解大数据的思维 人的判断优缺点: 之前的外地人素质低的例子,就有两个很重要的弱点,一个是我们人所收集的数据量很小,一个是不全。我们的判断基于我们遇到的有限的几个外地人,而且仅仅基于一个信息,就是他是不是外地人,对于他的教育水平,工作单位,年龄,性别等等都忽视了。而大数据恰好能弥补我们的这些缺点
  11. 新的模型:比如人慢慢长大,看待事物的方式不一样了,比如会从多个角度看待问题,会站在别人的立场看问题