Big data بزرگ داده ها

‫مقدمه‬‫بر‬ ‫ای‬Big Data
‫استاد‬:‫ی‬‫خنجر‬ ‫دکتر‬
‫دهندگان‬‫ائه‬‫ر‬‫ا‬:‫سهرابی‬ ‫امید‬ ،‫حسنوند‬ ‫سعید‬

www.company.com
‫مطالب‬ ‫فهرست‬
•Big Data‫چیست‬‫؟‬
•‫ا‬‫ر‬‫چ‬Big Data‫؟‬
•‫چالش‬‫پیشه‬‫های‬‫ی‬‫و‬‫ر‬Big Data
•‫آینده‬‫ی‬Big Data
•‫جنبش‬NoSQL
•‫انواع‬NoSQL
•MapReduce
•Hadoop
1

www.company.com
Big Data‫چیست؟‬2
•‫معنای‬‫ی‬‫لغو‬
•‫داده‬ ‫کالن‬
•‫داده‬‫حجیم‬‫های‬
•‫داده‬ ‫گ‬‫ر‬‫بز‬
•‫تعریف‬
•‫د‬‫ر‬‫ندا‬ ‫وجود‬‫واحدی‬‫تعریف‬!
•‫تعریف‬ ‫تمامی‬ ‫در‬ ‫اصلی‬ ‫عنصر‬ ‫دو‬‫ها‬
•‫داده‬ ‫از‬ ‫یادی‬‫ز‬ ‫حجم‬ ِ‫وجود‬‫ها‬
•‫پایگاه‬ ِ‫ناتوانی‬‫داده‬ ‫مدیریت‬ ‫در‬ ‫سنتی‬ ‫داده‬ ‫های‬‫ها‬

www.company.com
•‫ویژگی‬‫ها‬
Big Data

www.company.com
•‫داده‬‫حجم‬‫ها‬(Volume)
•‫سال‬ ‫تا‬2003‫داده‬ ‫کل‬ ‫حجم‬‫حدود‬ ،‫موجود‬ ‫های‬
5‫است‬ ‫بوده‬ ‫اگزابایت‬
•،‫روز‬ ‫دو‬ ‫هر‬ ‫در‬ ‫امروزه‬‫حدود‬5‫اگزابایت‬
‫می‬ ‫تولید‬ ‫داده‬‫شود‬
•‫ش‬‫ر‬‫گزا‬IBM
•‫تولید‬2.5‫روز‬ ‫در‬ ‫داده‬ ‫اگزابایت‬
•‫تولید‬90‫داده‬ ‫کل‬ ‫درصد‬‫دو‬ ‫در‬ ‫موجود‬ ‫های‬
‫اخیر‬ ‫سال‬
0.8 Zb 35.2 Zb‫رشدی‬44
‫برابری‬
2009
2020

www.company.com
•‫داده‬‫حجم‬‫ها‬(Volume)
•‫سال‬ ‫تا‬2003‫داده‬ ‫کل‬ ‫حجم‬‫حدود‬ ،‫موجود‬ ‫های‬
5‫است‬ ‫بوده‬ ‫اگزابایت‬
•،‫روز‬ ‫دو‬ ‫هر‬ ‫در‬ ‫امروزه‬‫حدود‬5‫اگزابایت‬
‫می‬ ‫تولید‬ ‫داده‬‫شود‬
•‫ش‬‫ر‬‫گزا‬IBM
•‫تولید‬2.5‫روز‬ ‫در‬ ‫داده‬ ‫اگزابایت‬
•‫تولید‬90‫داده‬ ‫کل‬ ‫درصد‬‫دو‬ ‫در‬ ‫موجود‬ ‫های‬
‫اخیر‬ ‫سال‬
EXA
218
PETA
215
TERA
212
ZETTA
221
GIGA
29
2018
2015
2012
2003

www.company.com
•‫ها‬ ‫داده‬‫حجم‬(Volume)

www.company.com
•‫نمونه‬‫ها‬
•‫فیسبوک‬(1392)
•‫بر‬‫ر‬‫کا‬ ‫د‬‫ر‬‫میلیا‬ ‫یک‬ ‫از‬ ‫بیش‬
•‫از‬ ‫بیش‬300‫داده‬ ‫پتابایت‬
•‫از‬‫بیش‬ ِ‫شدن‬ ‫اضافه‬50‫ز‬‫و‬‫ر‬ ‫در‬ ‫داده‬‫ترابایت‬
•‫از‬ ‫بیش‬35‫ی‬‫مجاز‬ ‫دنیای‬ ‫تصاویر‬ ِ‫کل‬ ‫از‬ ‫صد‬‫ر‬‫د‬
•‫گوگل‬(1390)
•‫داده‬ ‫پتابایت‬ ‫صد‬ ‫از‬ ‫بیش‬
–‫از‬ ‫بیش‬1000‫وب‬ ‫صفحه‬ ‫د‬‫ر‬‫میلیا‬
•‫حدود‬7.2‫جست‬ ‫د‬‫ر‬‫میلیا‬‫ز‬‫و‬‫ر‬ ‫در‬ ‫وجو‬

www.company.com
•‫یوتیوب‬(1393)
•‫داده‬‫اگزابایت‬ ‫یک‬ ‫از‬ ‫بیش‬
•‫ماه‬ ‫در‬ ‫بر‬‫ر‬‫کا‬ ‫د‬‫ر‬‫میلیا‬ ‫یک‬ ‫از‬ ‫بیش‬ ِ‫دید‬‫ز‬‫با‬
•80‫آمریکا‬ ‫از‬ ‫خارج‬‫ترافیک‬ ‫صد‬‫ر‬‫د‬
•‫دقیقه‬ ‫در‬ ‫فیلم‬ ‫ساعت‬ ‫صد‬ ‫شدن‬ ‫اضافه‬
•‫توییتر‬(1393)
•‫بر‬‫ر‬‫کا‬ ‫د‬‫ر‬‫میلیا‬ ‫یک‬ ‫حدود‬
•‫از‬ ‫بیش‬124‫سال‬ ‫در‬ ‫توییت‬ ‫د‬‫ر‬‫میلیا‬
•‫حدود‬4500‫ثانیه‬ ‫در‬ ‫توییت‬
•271‫ماه‬ ‫در‬ ‫فعال‬ ‫بر‬‫ر‬‫کا‬ ‫ن‬‫میلیو‬

www.company.com
•‫شبکه‬‫حسگر‬ ‫های‬
•‫مان‬‫ز‬‫سا‬‫ی‬ ‫هواشناس‬ ‫های‬
•‫دستگاه‬‫پزشکی‬‫های‬
•‫ماتیک‬‫ر‬‫بیوانفو‬
•‫مان‬‫ز‬‫سا‬‫گ‬‫ر‬‫بز‬ ‫های‬
•‫و‬...

www.company.com
Big Data

www.company.com
•‫داده‬ ‫در‬ ‫تنوع‬‫ها‬(Variety)
•‫داده‬‫های‬‫مند‬‫ر‬‫ساختا‬(Structured)
•‫داده‬‫هستند‬ ‫مشخصی‬ ِ‫ساختار‬ ‫دارای‬ ‫که‬ ‫هایی‬
–‫ها‬ ‫رشته‬
–‫اعداد‬
–‫تاریخ‬
–‫و‬...
•‫حدود‬20‫داده‬ ‫کل‬ ‫از‬ ‫درصد‬،‫موجود‬ ‫های‬
‫هستند‬ ‫ساختارمند‬
•‫پایگاه‬ ‫از‬ ‫استفاده‬‫داده‬ ‫های‬‫رابطه‬ ‫ی‬‫ای‬

www.company.com
•‫داده‬‫مند‬‫ر‬‫ساختا‬‫های‬(Structured)
•‫داده‬‫های‬‫مند‬‫ر‬‫ساختا‬‫نیمه‬(Semi-Structured)
•‫ندارند‬ ‫مشابه‬ ‫و‬ ‫سازگار‬ ‫ساختاری‬
–XML
–Tweets
–SGML
–Logs
–‫و‬...
•‫ی‬ ‫داده‬ ‫های‬ ‫پایگاه‬ ‫از‬ ‫استفاده‬ ‫امکان‬ ‫عدم‬
‫رابطه‬‫ای‬

www.company.com
•‫داده‬‫مند‬‫ر‬‫ساختا‬‫های‬(Structured)
•‫داده‬‫های‬‫مند‬‫ر‬‫ساختا‬‫نیمه‬(Semi-Structured)
•‫داده‬‫های‬‫ساختار‬ ‫فاقد‬(Unstructured)
•‫هستند‬ ‫ساختاری‬ ‫هرگونه‬ ‫فاقد‬
–‫داده‬‫رسانه‬ ‫چند‬ ‫های‬‫ای‬(‫و‬ ‫صوت‬ ،‫فیلم‬)...
–‫ایمیل‬‫ها‬
–‫گزارشات‬
–‫ارائه‬‫ها‬
–‫و‬....
•‫حدود‬70‫تا‬90‫داده‬ ‫کل‬ ‫از‬ ‫درصد‬‫موجود‬ ‫های‬

www.company.com
•‫ها‬‫داده‬ ‫در‬ ‫تنوع‬(Variety)

www.company.com
Big Data

www.company.com
•‫داده‬‫سریع‬‫شد‬‫ر‬‫ها‬(velocity)
•‫داد‬ ِ‫تولید‬ ‫در‬‫باال‬‫سرعت‬‫ه‬‫جدید‬‫های‬

www.company.com
•‫داده‬‫سریع‬‫شد‬‫ر‬‫ها‬(velocity)
•‫داده‬ ‫تولید‬ ‫در‬‫باال‬‫سرعت‬‫جدید‬‫های‬
•‫جوها‬ ‫و‬‫پرس‬‫ایجاد‬ ‫در‬ ‫باال‬‫سرعت‬
‫علمی‬ ‫تجهیزات‬ ‫شبکه‬‫حسگر‬ ‫های‬

www.company.com
•‫پیچیدگی‬(complexity)
•‫ی‬‫تغییرپذیر‬(Variability)
•‫و‬...
Big Data
3V’s •‫ویژگی‬‫ها‬

www.company.com
‫ا‬‫ر‬‫چ‬Big Data‫؟‬19
•‫شد‬‫ر‬‫ی‬‫ساز‬‫ذخیره‬ ‫ادوات‬ ‫ظرفیت‬‫ن‬‫و‬‫افز‬ ‫ز‬‫و‬‫ر‬

www.company.com
•‫ی‬‫ساز‬‫ذخیره‬‫ادوات‬ ‫ظرفیت‬‫ن‬‫و‬‫افز‬ ‫ز‬‫و‬‫ر‬ ‫شد‬‫ر‬
•‫چشم‬‫افزایش‬‫سیستم‬‫ی‬ ‫ش‬‫ز‬‫پردا‬ ‫ت‬‫ر‬‫قد‬ ‫گیر‬‫ها‬

www.company.com
•‫ی‬‫ساز‬‫ذخیره‬‫ادوات‬ ‫ظرفیت‬‫ن‬‫و‬‫افز‬ ‫ز‬‫و‬‫ر‬ ‫شد‬‫ر‬
•‫چشم‬‫افزایش‬‫سیستم‬‫ی‬ ‫ش‬‫ز‬‫پردا‬ ‫ت‬‫ر‬‫قد‬ ‫گیر‬‫ها‬
•‫داده‬ ‫حجم‬‫افزایش‬‫موجود‬‫های‬

www.company.com
‫چالش‬‫پیش‬‫های‬‫ی‬‫و‬‫ر‬Big Data22
•‫ش‬‫و‬‫ر‬‫ایی‬‫ر‬‫کا‬‫عدم‬‫اطالعات‬‫تحلیل‬ ‫سنتی‬‫های‬
•‫داده‬‫تحلیل‬
•‫ی‬ ‫شخص‬‫حریم‬ ‫و‬‫امنیت‬
•‫ی‬ ‫ش‬‫ز‬‫پردا‬‫و‬ ‫فنی‬‫مشکالت‬

www.company.com
‫آینده‬‫ی‬Big Data23
•Big Data‫در‬Google Trend

www.company.com
•Big Data‫در‬Google Trend

www.company.com
•‫ی‬ ‫هش‬‫و‬‫پژ‬‫جایگاه‬Big Data‫موسسه‬ ‫نظر‬‫از‬‫تنر‬‫ر‬‫گا‬‫ی‬

www.company.com
‫ای‬‫ر‬‫ب‬ ‫ی‬‫ژ‬‫تکنولو‬ ‫چه‬Big Data‫؟‬ ‫د‬‫ر‬‫دا‬ ‫وجود‬
‫شده‬‫یع‬‫ز‬‫تو‬ ‫و‬‫ساختار‬ ‫ن‬‫بدو‬ ‫مدل‬ ‫یک‬‫از‬‫استفاده‬
‫مدل‬ ‫این‬ ‫از‬‫استفاده‬ ‫دلیل‬
26

www.company.com
‫جنبش‬NoSQL27
‫یخچه‬‫ر‬‫تا‬
Not Only SQL
NoSQL‫که‬ ‫کند‬‫نمی‬ ‫بیان‬SQL‫و‬‫شود‬‫استفاده‬ ‫نباید‬ ‫هیچگاه‬
‫است‬‫مرده‬ ‫یا‬

‫ای‬‫ابطه‬‫ر‬ ‫غیر‬ ‫های‬‫داده‬‫پایگاه‬‫از‬‫هایی‬‫مثال‬Company
LOGO
28

www.company.com
‫جنبش‬NoSQL–Key Value29
1–‫ی‬‫ساز‬‫ذخیره‬Key – Value:
•‫ای‬‫داده‬‫مدل‬:‫کلید‬‫های‬‫ج‬‫و‬‫ز‬ ‫از‬‫ای‬‫مجموعه‬–‫مقدار‬
•‫مثال‬:Tokyo , Redis , Voldemort

www.company.com
‫جنبش‬NoSQL–Column30
2–‫ر‬‫محو‬ ‫ن‬‫ستو‬‫ی‬‫ساز‬‫ذخیره‬:
•‫ای‬‫داده‬‫مدل‬:‫سطرها‬ ‫جای‬‫به‬‫ها‬‫ن‬‫ستو‬ ‫ی‬‫ساز‬‫ذخیره‬
•‫مثال‬:Cassandra, HyperTable, HBase

www.company.com
‫جنبش‬NoSQL–Document31
3–‫سندگرا‬‫ی‬‫ساز‬‫ذخیره‬:
•‫ای‬‫داده‬‫مدل‬:‫کلید‬‫ی‬‫مجموعه‬ ‫از‬‫ای‬‫مجموعه‬-‫ها‬‫ر‬‫مقدا‬
•‫مثال‬:CouchDB , MongoDB

www.company.com
‫جنبش‬NoSQL–Graph32
4–‫گراف‬‫ی‬‫ساز‬‫ذخیره‬:
•‫ای‬‫داده‬‫مدل‬:‫کلید‬ ،‫ها‬‫تباط‬‫ر‬‫ا‬،‫ها‬‫گره‬–‫هرکدام‬‫ی‬‫و‬‫ر‬ ‫مقدار‬
•‫مثال‬:Sones, AllegroGraph , Neo4j

‫ای‬‫ابطه‬‫ر‬ ‫غیر‬ ‫های‬‫داده‬‫پایگاه‬‫از‬‫هایی‬‫مثال‬Company
LOGO
33

www.company.com
‫های‬‫ک‬‫ر‬‫و‬ ‫فریم‬ ‫مقایسه‬NoSQL34
 MySQL
 MongoDB ‫یا‬ CouchDB
 Neo4j

www.company.com
Hadoop36
Hadoop‫همان‬ ،VMware‫متفاوت‬ ‫اهی‬‫ر‬‫در‬‫اما‬ ‫هست‬

‫تفاوت‬Hadoop‫ی‬‫مجاز‬ ‫ماشین‬ ‫و‬Company
LOGO37
Hadoop
1.‫فیزیکی‬ ‫سرور‬ ‫چند‬
‫گیرد‬‫می‬ ‫را‬
2.‫هم‬ ‫با‬ ‫را‬ ‫آنها‬
‫کند‬‫می‬ ‫ترکیب‬
3.‫بزرگ‬ ‫سرور‬ ‫یک‬
‫دهد‬‫می‬ ‫ارائه‬ ‫مجازی‬
Vmware
1.‫فیزیکی‬ ‫سرور‬ ‫یک‬
‫گیرد‬‫می‬
2.‫شکند‬‫می‬ ‫را‬ ‫آن‬
3.‫مجازی‬ ‫سرور‬ ‫چند‬
‫دهد‬‫می‬ ‫ارائه‬

www.company.com
‫ی‬‫گیر‬ ‫نتیجه‬38
‫ک‬‫ر‬‫و‬‫فریم‬‫یک‬ ‫که‬ ‫گفت‬ ‫قاطعیت‬ ‫با‬‫توان‬‫نمی‬NoSQL
‫است‬ ‫کار‬ ‫یک‬‫مختص‬

‫منابع‬Company
LOGO39
1 - http://www.economistinsights.com/sites/default/files/downloads/
EIU_SAS_BigData_4.pdf
2 - http://en.wikipedia.org/wiki/MapReduce
3 - http://en.wikipedia.org/wiki/NoSQL
4 - http://www.ibm.com/big-data/us/en/
5 - Marco Grobelink,Jozef stefan Institute,Big-Data Tutorial, 2013.

www.company.com
‫پاسخ‬ ‫و‬ ‫پرسش‬40

Big data بزرگ داده ها

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (20)

Similar to Big data بزرگ داده ها

Similar to Big data بزرگ داده ها (20)

Big data بزرگ داده ها