Zalecana, 2024

Wybór redaktorów

Microsoft rozszerza Azure Data Lake o nowe narzędzia do dużych zbiorów danych

Azure Data Lake Storage Gen2 on Azure Government

Azure Data Lake Storage Gen2 on Azure Government
Anonim

Firma Microsoft skupiła się na dużych danych, gdy wprowadziła swoje jezioro Azure Data w tym roku, aw poniedziałek rozszerzyła ten wysiłek dzięki nowym narzędziom zaprojektowanym, aby uprościć i zwiększyć dostępność przetwarzania i analizowania dużych zbiorów danych.

Najpierw nazwa Microsoft Azure Data Lake została zmieniona na Azure Data Lake Store, oferując pojedyncze repozytorium dla danych dowolnego rozmiaru i typu - w tym niestrukturalne, półstrukturalne i strukturalne - bez konieczności wprowadzania zmian w aplikacjach jako skal danych.

Dane mogą być tam bezpiecznie udostępniane i udostępniane do przetwarzania i analizy. Może być pozyskiwany w czasie rzeczywistym z czujników i urządzeń do aplikacji Internet of Things (IoT), na przykład, lub ze stron internetowych zakupów online, bez ograniczeń dotyczących konta lub rozmiaru pliku.

Dostępny w podglądzie jeszcze w tym roku sklep jest kompatybilny z Hadoop Distributed File System (HDFS), więc dystrybucje Hadoop, takie jak Hortonworks, MapR i Cloudera, mogą łatwo uzyskać dostęp do danych w celu przetwarzania i analizowania, powiedział Microsoft.

Po drugie, usługa Azure Data Lake Analytics dodaje do części magazynowej Azure Data Lake z nową, dynamicznie skalowalną usługą analityczną zbudowaną na serwerze Apache YARN, która będzie dostępna również w wersji pod koniec bieżącego roku.

Nowa usługa analityczna obejmuje język zapytań U-SQL, którego skalowalna i rozproszona funkcja zapytań pozwala użytkownikom wydajnie analizować dane w magazynie Azure Data Lake i przez serwery SQL w Azure, Azure SQL Database i Azure SQL Data Warehouse, powiedział Microsoft.

Wreszcie, Microsoft Azure HDInsight jest teraz włączony n Azure Data Lake, oferując w pełni zarządzaną usługę klastrową Apache Hadoop z mechanizmami analitycznymi open source, w tym Hive, Spark, HBase i Storm. Od poniedziałku zarządzane klastry w systemie Linux są na ogół dostępne z umową SLA (Service Level Agreement), która zapewnia 99,9% czasu sprawności.

Obsługą Azure Data Lake są też Azure Data Lake Tools for Visual Studio, które zapewniają zintegrowane środowisko programistyczne, obejmuje usługi Azure Data Lake i wiodące aplikacje Hadoop od niezależnych dostawców oprogramowania obejmujące bezpieczeństwo, zarządzanie, przygotowywanie danych i analizy, powiedział Microsoft.

Szczegóły dotyczące cen nie były natychmiast dostępne.

Top