Was ist Big Data?

Was ist Big Data?

Big Data bezieht sich auf riesige komplexe strukturierte und unstrukturierte Datensätze, die schnell aus einer Vielzahl von Quellen erzeugt und übertragen werden.

Was sind große Daten?

Unter Big Data versteht man riesige komplexe strukturierte und unstrukturierte Datensätze, die schnell erzeugt und aus einer Vielzahl von Quellen übertragen werden. Diese Eigenschaften machen die drei Vs von Big Data aus:

  • Volumen: Die riesigen Datenmengen, die gespeichert werden.
  • Schnelligkeit: Die blitzartige Geschwindigkeit, mit der Datenströme verarbeitet und analysiert werden müssen.
  • Vielfältigkeit: Die verschiedenen Quellen und Formen, aus denen Daten gesammelt werden, wie z. B. Zahlen, Text, Video, Bilder, Audio und Text.

Heutzutage werden ständig Daten generiert, wenn wir eine App öffnen, eine Google-Suche durchführen oder einfach mit unseren mobilen Geräten von Ort zu Ort reisen. Das Ergebnis? Riesige Sammlungen wertvoller Informationen, die von Unternehmen und Organisationen verwaltet, gespeichert, visualisiert und analysiert werden müssen.

Herkömmliche Datentools sind nicht in der Lage, diese Art von Komplexität und Volumen zu bewältigen, was zu einer Reihe spezialisierter Big-Data-Software und -Architekturlösungen geführt hat, die zur Bewältigung dieser Last entwickelt wurden.

WAS SIND BIG-DATA-PLATTFORMEN?

Big-Data-Plattformen sind speziell für die Bewältigung unüberschaubarer Datenmengen konzipiert, die mit hoher Geschwindigkeit und in großer Vielfalt in das System gelangen. Diese Big-Data-Plattformen bestehen in der Regel aus verschiedenen Servern, Datenbanken und Business-Intelligence-Tools, die es Datenwissenschaftlern ermöglichen, Daten zu manipulieren, um Trends und Muster zu erkennen.

Big Data ist im Wesentlichen der Umgang mit den drei Vs, um Erkenntnisse zu gewinnen und Vorhersagen zu treffen, daher ist es sinnvoll, die einzelnen Attribute näher zu betrachten.

Umfang

Big data sind enorm. Während herkömmliche Daten in bekannten Größen wie Megabyte, Gigabyte und Terabyte gemessen werden, werden Big Data in Petabyte und Zettabyte gespeichert.

Um den enormen Größenunterschied zu begreifen, sollten Sie sich diesen Vergleich der Berkeley School of Information vor Augen führen: Ein Gigabyte entspricht einem siebenminütigen HD-Video, während ein einziges Zettabyte 250 Milliarden DVDs entspricht.

Dies ist nur die Spitze des Eisbergs. Einem Bericht von EMC zufolge verdoppelt sich die Größe des digitalen Universums alle zwei Jahre und wird bis 2020 voraussichtlich 44 Billionen Zettabyte erreichen.

Big Data stellt die Architektur für die Verarbeitung dieser Art von Daten bereit. Ohne die entsprechenden Lösungen für die Speicherung und Verarbeitung wäre es unmöglich, Erkenntnisse zu gewinnen.

Geschwindigkeit

Von der Geschwindigkeit, mit der die Daten erzeugt werden, bis hin zu der Zeit, die für ihre Analyse benötigt wird, ist alles an Big Data schnell. Manche haben es so beschrieben, als würde man versuchen, aus einem Feuerwehrschlauch zu trinken.

Unternehmen und Organisationen müssen in der Lage sein, diese Daten in Echtzeit zu nutzen und daraus Erkenntnisse zu gewinnen, sonst sind sie nicht sehr nützlich. Die Verarbeitung in Echtzeit ermöglicht es den Entscheidungsträgern, schnell zu handeln, und verschafft ihnen einen Vorsprung vor der Konkurrenz.

Während einige Arten von Daten in Stapeln verarbeitet werden können und über einen längeren Zeitraum hinweg relevant bleiben, strömen viele Big Data in kürzester Zeit in die Unternehmen und erfordern sofortiges Handeln, um die besten Ergebnisse zu erzielen. Sensordaten von Gesundheitsgeräten sind ein gutes Beispiel dafür. Die Fähigkeit zur sofortigen Verarbeitung von Gesundheitsdaten kann Benutzern und Ärzten potenziell lebensrettende Informationen liefern.

Vielfalt

Etwa 95 % aller Big Data sind unstrukturiert, d. h. sie lassen sich nicht ohne weiteres in ein einfaches, traditionelles Modell einordnen. Alles, von E-Mails und Videos bis hin zu wissenschaftlichen und meteorologischen Daten, kann einen Big Data-Strom bilden, jeder mit seinen eigenen einzigartigen Eigenschaften.

ANWENDUNGEN

Wie werden Big Data genutzt?

Die Vielfalt von Big Data macht sie von Natur aus komplex, so dass Systeme erforderlich sind, die die verschiedenen strukturellen und semantischen Unterschiede verarbeiten können.

Big Data erfordert spezialisierte NoSQL-Datenbanken, die die Daten so speichern können, dass sie sich nicht strikt an ein bestimmtes Modell halten müssen. Dies bietet die nötige Flexibilität, um scheinbar disparate Informationsquellen kohärent zu analysieren, um einen ganzheitlichen Überblick über die Geschehnisse zu erhalten und zu erfahren, wie und wann gehandelt werden muss.

Bei der Aggregation, Verarbeitung und Analyse von Big Data werden diese häufig entweder als operative oder analytische Daten klassifiziert und entsprechend gespeichert.

Operative Systeme verarbeiten große Datenmengen auf mehreren Servern und umfassen Eingaben wie Lagerbestände, Kundendaten und Einkäufe - die alltäglichen Informationen innerhalb eines Unternehmens.

Analytische Systeme sind anspruchsvoller als ihre operativen Gegenstücke, sie sind in der Lage, komplexe Datenanalysen durchzuführen und den Unternehmen Entscheidungsgrundlagen zu liefern. Diese Systeme werden oft in bestehende Prozesse und Infrastrukturen integriert, um die Erfassung und Nutzung von Daten zu maximieren.

Unabhängig davon, wie sie klassifiziert werden, sind Daten überall. Unsere Telefone, Kreditkarten, Softwareanwendungen, Fahrzeuge, Aufzeichnungen, Websites und die meisten "Dinge" in unserer Welt sind in der Lage, riesige Datenmengen zu übermitteln, und diese Informationen sind unglaublich wertvoll.

Big Data wird in fast allen Branchen eingesetzt, um Muster und Trends zu erkennen, Fragen zu beantworten, Einblicke in die Kunden zu gewinnen und komplexe Probleme zu lösen. Unternehmen und Organisationen nutzen die Informationen aus einer Vielzahl von Gründen, z. B. um ihr Geschäft auszubauen, Kundenentscheidungen zu verstehen, die Forschung zu verbessern, Prognosen zu erstellen und wichtige Zielgruppen für Werbung anzusprechen.

BIG-DATA-BEISPIELE

  • Personalisierte E-Commerce-Einkaufserlebnisse
  • Modellierung von Finanzmärkten
  • Zusammenstellung von Billionen von Datenpunkten zur Beschleunigung der Krebsforschung
  • Medienempfehlungen von Streaming-Diensten wie Spotify, Hulu und Netflix
  • Vorhersage von Ernteerträgen für Landwirte
  • Analyse von Verkehrsmustern zur Verringerung von Staus in Städten
  • Datentools zur Erkennung von Einkaufsgewohnheiten im Einzelhandel und zur optimalen Produktplatzierung
  • Big Data hilft Sportteams, ihre Effizienz und ihren Wert zu maximieren
  • Erkennen von Trends in den Bildungsgewohnheiten von einzelnen Schülern, Schulen und Bezirken
  • Hier sind einige Beispiele für Branchen, in denen die Big-Data-Revolution bereits im Gange ist:

Finanzen

Die Finanz- und Versicherungsbranche nutzt Big Data und prädiktive Analysen unter anderem für die Betrugserkennung, Risikobewertungen, Bonitätseinstufungen, Maklerdienste und die Blockchain-Technologie.

Finanzinstitute nutzen Big Data auch, um ihre Cybersicherheitsmaßnahmen zu verbessern und Finanzentscheidungen für Kunden zu personalisieren.

Gesundheitswesen

Krankenhäuser, Forscher und Pharmaunternehmen setzen Big-Data-Lösungen ein, um die Gesundheitsversorgung zu verbessern und voranzutreiben.

Dank des Zugriffs auf riesige Mengen an Patienten- und Bevölkerungsdaten kann das Gesundheitswesen Behandlungen verbessern, Krankheiten wie Krebs und Alzheimer effektiver erforschen, neue Medikamente entwickeln und wichtige Einblicke in Muster der Bevölkerungsgesundheit gewinnen.

Medien und Unterhaltung

Wenn Sie jemals Netflix, Hulu oder andere Streaming-Dienste genutzt haben, die Empfehlungen aussprechen, haben Sie Big Data bei der Arbeit erlebt.

Medienunternehmen analysieren unsere Lese-, Seh- und Hörgewohnheiten, um individualisierte Erlebnisse zu schaffen. Netflix verwendet sogar Daten zu Grafiken, Titeln und Farben, um Entscheidungen über Kundenpräferenzen zu treffen.

Landwirtschaft

Von der Entwicklung von Saatgut bis hin zur Vorhersage von Ernteerträgen mit verblüffender Genauigkeit - Big Data und Automatisierung verbessern die Landwirtschaftsbranche rasant.

Durch den Zustrom von Daten in den letzten zwei Jahrzehnten sind Informationen in vielen Ländern reichlicher vorhanden als Lebensmittel, was Forscher und Wissenschaftler dazu veranlasst, Big Data zu nutzen, um Hunger und Unterernährung zu bekämpfen. Mit Gruppen wie der Global Open Data for Agriculture & Nutrition (GODAN), die sich für einen offenen und uneingeschränkten Zugang zu globalen Ernährungs- und Agrardaten einsetzen, werden einige Fortschritte im Kampf gegen den Hunger in der Welt erzielt.

Weitere Anwendungsbereiche

  • Werbung und Marketing
  • Unternehmen
  • E-Commerce und Einzelhandel
  • Bildung
  • Internet der Dinge
  • Sport

Das könnte dich auch interessieren