Какво представляват големите данни - просто обяснение с пример

Терминът Big Data се използва все по-често почти навсякъде по планетата – онлайн и офлайн. И това не е свързано само с компютрите. Той идва под общ термин, наречен Информационни технологии(Information Technology) , който сега е част от почти всички други технологии и области на обучение и бизнес. Големите данни(Big Data) не са голяма работа. Шумът около него е доста голяма работа, за да ви обърка. Тази статия разглежда какво представляват Big Data . Той също така съдържа пример за това как NetFlix използва своите данни, или по-скоро Big Data , за да обслужва по-добре нуждите на своите клиенти.

Какво е Big Data

Какво е Big Data

Данните, които лежат в сървърите на вашата компания, бяха само данни до вчера – сортирани и записани. Изведнъж жаргонът Big Data стана популярен и сега данните във вашата компания са Big Data . Терминът обхваща всяка част от данни, която вашата организация е съхранявала досега. Той включва данни, съхранявани в облаци, и дори URL адресите(URLs) , които сте отбелязали. Вашата компания може да не е дигитализирала всички данни. Може вече да не сте структурирали всички данни. Но тогава всички цифрови, хартиени, структурирани и неструктурирани данни във вашата компания вече са Big Data .

Накратко, всички данни – независимо дали са категоризирани или не – присъстващи във вашите сървъри се наричат ​​общо ГОЛЕМИ ДАННИ(BIG DATA) . Всички тези данни могат да се използват за получаване на различни резултати с помощта на различни видове анализи. Не е необходимо всички анализи да използват всички данни. Различният анализ използва различни части от ГОЛЕМИТЕ ДАННИ(BIG DATA) , за да произведе необходимите резултати и прогнози.

Големите данни(Big Data) по същество са данните, които анализирате за резултати, които можете да използвате за прогнози и други цели. Когато използвате термина Big Data , изведнъж вашата компания или организация работи с информационни(Information) технологии от най-високо ниво, за да изведе различни типове резултати, използвайки същите данни, които сте съхранявали умишлено или неволно през годините.

Колко големи са Big Data

По същество всички комбинирани данни са големи данни(Big Data) , но много изследователи са съгласни, че големите данни –(Big Data –) като такива – не могат да бъдат манипулирани с помощта на нормални електронни таблици и редовни инструменти за управление на база данни. Те се нуждаят от специални инструменти за анализ като Hadoop (ще проучим това в отделна публикация), така че всички данни да могат да бъдат анализирани наведнъж (може да включват итерации на анализ).

Противно на горното, въпреки че не съм експерт по темата, бих казал, че данните с всяка организация – голяма или малка, организирана или неорганизирана – са големи данни за тази организация и че организацията може да избере свои собствени инструменти за анализ на данни.(Contrary to the above, though I am not an expert on the subject, I would say that data with any organization – big or small, organized or unorganized – is Big Data for that organization and that the organization may choose its own tools to analyze the data.)

Обикновено за анализиране на данни хората създават различни набори от данни въз основа на едно или повече общи полета, така че анализът става лесен. В случая с големи данни(Big Data) няма нужда да създавате подмножества за анализирането им. Вече имаме инструменти, които могат да анализират данни, независимо колко огромни са те. Вероятно самите тези инструменти категоризират данните, дори когато ги анализират.

Намирам за важно да спомена две изречения от книгата „Големи данни“ на Джими Гутерман(Jimmy Guterman) :

Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”

-И-

“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”

Така че виждате, че обемът и анализът са важна част от големите данни(Big Data) .

Прочетете(Read) : Какво е Data Mining?(What is Data Mining?)

Концепции за големи данни

Това е друг момент, с който повечето хора не са съгласни. Някои експерти казват, че концепциите за големи данни(Big Data Concepts) са три V:

  1. Сила на звука
  2. Скорост
  3. Разнообразие

Някои други добавят още няколко V към концепцията:

  1. Визуализация
  2. Достоверност (Надеждност)
  3. Променливост и
  4. Стойност

Ще разгледам концепциите за големите данни(Big Data) в отделна статия, тъй като тази публикация вече става голяма. Според мен първите три V са достатъчни, за да обяснят концепцията за големи данни(Big Data) .

Пример за големи данни – как NetFlix(Big Data Example – How NetFlix) го използва, за да отстрани проблемите си

Към 2008 г. имаше прекъсване в NetFlix , поради което много клиенти останаха на тъмно. Докато някои все още могат да имат достъп до услугите за стрийминг, повечето от тях не могат. Някои клиенти успяха да получат своите наети DVD(DVDs) , докато други не успяха. В публикация в блога на Wall Street Journal се казва , че Netflix току-що е започнал стрийминг при поискване.

Прекъсването накара ръководството да се замисли за възможните бъдещи проблеми и следователно; се обърна към Big Data . Той анализира зони с висок трафик, податливи точки и мрежова пропускателна способност и т.н., използвайки тези данни и работи върху тях, за да намали времето за престой, ако възникне бъдещ проблем, тъй като той стане глобален. Ето връзката(the link) към блога на Wall Street Journal(Wall Street Journal Blog) , ако искате да разгледате примерите за големи данни(Big Data) .

Горното обобщава какво представляват Big Data на езика на лаиците. Можете да го наречете много основно въведение. Планирам да напиша още няколко статии за свързани фактори като – Концепции(Concepts) , Анализ(Analysis) , Инструменти(Tools) и използване на Big Data(uses of Big Data) , Big Data 3 V и т.н. Междувременно, ако искате да добавите нещо към горното, моля, коментирайте и споделете с нас.

Прочетете по-нататък(Read next) : Какво е Web Scraping ?



About the author

След близо 20 години в технологичната индустрия научих много за продуктите на Apple и как да ги персонализирам за моите нужди. По-конкретно, знам как да използвам платформата iOS, за да създавам персонализирани изяви и да взаимодействам с моите потребители чрез предпочитания за приложения. Този опит ми даде ценна представа за това как Apple проектира своите продукти и как най-добре да подобри тяхното потребителско изживяване.



Related posts