Einführung in SAS Viya: Datenanalyse und Machine Learning in der Cloud

Montag, 5.6.2023

SAS Viya ist die offene, cloudbasierte Plattform für Datenanalysen von SAS. In unserem ersten Blogpost zu SAS Viya geben wir eine erste Einführung in die Funktionalitäten und vergleichen die Lösung mit SAS 9.4.Datenanalysen-SAS-Viya-eine-einfuehrung

In der heutigen Geschäftswelt ist es wichtiger denn je, Daten schnell und effektiv zu analysieren, um fundierte Entscheidungen zu treffen und wettbewerbsfähig zu bleiben. Die Menge der verfügbaren Daten wächst ständig, und Unternehmen müssen in der Lage sein, diese Daten schnell zu verarbeiten und zu analysieren, um umfassende Einblicke zu gewinnen. 

Die zunehmende Bedeutung von Datenanalyse in der heutigen Geschäftswelt hat zu einer Vielzahl von Datenanalyse-Plattformen geführt, die von Unternehmen genutzt werden können. Eine mögliche Lösung ist SAS Viya, eine offene, cloudbasierte Plattform für die Datenanalyse, die von der Firma SAS Institute entwickelt wurde. Sie ermöglicht es Unternehmen, große Mengen an Daten in Echtzeit zu verarbeiten, zu analysieren und zu visualisieren, um schnellere und genauere Entscheidungen zu treffen. Durch die Nutzung von Plattformen wie SAS Viya können Unternehmen eine umfassende, schnelle und skalierbare Lösung für die Datenanalyse nutzen und somit wettbewerbsfähig bleiben. 

 

Funktionalitäten von sas Viya

Die Plattform umfasst eine Vielzahl von Tools und Funktionen, darunter Datenmanagement, Datenvisualisierung und Machine Learning. 

Data Management 

  • Verschiedene Funktionen zur Datenvorbereitung, z.B. Datenbereinigung, Datentransformation und Datenvalidierung
  • Laden und Importieren aus einer Vielzahl unterstützter Datenquellen, einschließlich Datenbanken und Hadoop-Clustern (Datenintegration) 
  • Funktionen zum Schutz sensibler Daten und zur Überwachung von Datenänderungen, die zur Data Governance beitragen und die Sicherheit wichtiger Datenbestände gewährleisten 

Visual Analytics 

  • Datenexploration zur Erkennung von Mustern, Beziehungen und Trends in Ihren Daten 
  • Erstellung interaktiver Berichte zur Darstellung der Analyseergebnisse 
  • Mobile Verfügbarkeit von Reports über die Visual Analytics App  

Data Mining / Machine-Learning: 

  • Stellt zusätzlich zu Visual Analytics fortgeschrittene Analysemethoden zur Verfügung 
  • Datenaufbereitung: Datenexploration, Feature Engineering, Datenverwaltungsroutinen und Sampling 
  • Verwaltung von Machine-Learning-Modellen: Import, Export, Erstellung und Versionierung 
  • Training, Evaluierung und Optimierung von ML-Modellen 
  • Einsatz und Überwachung von ML-Modellen 
  • Python- und R-Unterstützung 

Unterschiede SAS VIYA zu SAS 9.4 

SAS Viya bietet nicht nur die Kernfunktionalitäten, sondern auch einige entscheidende Vorteile gegenüber der Vorgängerplattform SAS 9.4. Eine der hervorstechenden Eigenschaften von SAS Viya ist die Möglichkeit, analytische Anwendungen und Daten in der Cloud zu hosten. Dadurch kann die Plattform beliebig skaliert und flexibel an bestehende Anforderungen angepasst werden. Diese Flexibilität führt zu einer höheren Verfügbarkeit von Anwendungen, Daten und Reports. Darüber hinaus wird durch das "Pay-As-You-Go"-Kostenmodell nur das bezahlt, was tatsächlich genutzt wird. Im Gegensatz zu einer On-Premise-Lösung entfallen damit die Kosten für die Wartung und Aktualisierung von Hardware.  

Neben der Cloud-Fähigkeit ist die Einführung des Cloud Analytics Service (CAS) das einflussreichste Feature von SAS Viya. Mit CAS wird eine leistungsfähige In-Memory-Engine zur Verfügung gestellt, die auf Basis skalierbarer und leistungsstarker Multithreading-Algorithmen eine effiziente Verarbeitung von Big Data ermöglicht. Idealerweise unterstützt CAS dabei einen Großteil der üblichen SAS Language Statements, so dass auch bestehender SAS 9.4 Code CAS-kompatibel ist. Sprach-Konstrukte, die nicht von CAS unterstützt werden, können unter in der Dokumentation eingesehen werden.

 

Architektur 

Der Umfang der Implementierung (Deployment) von SAS Viya hängt von verschiedenen Parametern ab und wird an die spezifischen Bedürfnisse und Anforderungen des Benutzers angepasst. Viya kann beispielsweise entweder On-Premise oder in der Cloud betrieben werden. Der Ort der Bereitstellung kann sich auf den Umfang des Deployments der SAS Viya-Installation auswirken. Wenn eine vollständige Implementierung gewünscht ist, die alle Komponenten von SAS Viya umfasst, wie z.B. SAS Viya-Server, -Dienste und -Anwendungen, dann würde die Plattformarchitektur wie folgt aussehen: 

Architektur-SAS-Viya

Quelle: SAS Help Center

 

SAS Cloud Analytics Services

Für CAS gibt es zwei mögliche Ausgestaltungsvarianten: Distributed vs. Non-Distributed Installation. Während bei der Distributed Installation mehrere Worker-Nodes eingesetzt werden, um sehr große Datenmengen parallel zu verarbeiten (MPP), wird bei der Non-Distributed Installation eine einzelne Recheneinheit verwendet (SMP). 

Im MPP-Modus wird der Workload über einen Controller-Node koordiniert und den einzelnen Worker-Nodes zugewiesen, die dann die Verarbeitung im Arbeitsspeicher durchführen. Ein großer Vorteil dieser Architektur ist die hohe Ausfalltoleranz, die durch eine redundante Datenhaltung gewährleistet werden kann. Fällt ein Worker-Node aus, so wird ein neuer Node mit der Verarbeitung derselben Daten beauftragt. Für den Fall, dass die Verarbeitungszeit zu langsam wird, kann die Architektur durch Hinzufügen neuer Recheneinheiten beliebig skaliert werden. 

Im SMP-Modus gibt es keinen Worker-Node, stattdessen findet die In-Memory-Verarbeitung auf einem einzigen Controller-Node statt. Obwohl Daten nicht parallel in den Speicher der Recheneinheit geladen werden können, können mehrere CPUs und Threads verwendet werden, um die Verarbeitungszeit zu verkürzen. 

 

Programming run-time SAS-Studio

SAS-Studio ist das zentrale Werkzeug der Laufzeitumgebung und ermöglicht das Schreiben und Ausführen von Code über den Browser. 

 

Microservices

Durch die Verwendung von Microservices stellt SAS Viya sicher, dass sich migrationsfähige Komponenten stets an die Weiterentwicklung der Infrastruktur anpassen können. Einige Beispiele von Microservices im Kontext von SAS Viya sind der Job Launcher, der Model Manager und der Report Viewer, die jeweils eigenständige und skalierbare Komponenten der SAS Viya-Plattform darstellen. Dieses Architekturkonzept ermöglicht kürzere Startzeiten einzelner Services, höhere Resilienz, Skalierbarkeit und Verfügbarkeit. Dank der geringeren Abhängigkeiten können eigenständige Microservices parallel gestartet werden, was zu kürzeren Startzeiten führt und die Resilienz der Plattform erhöht. Es gibt jedoch zwei Ausnahmen: Wenn SASLogon oder Identities abstürzen, steht das System still. 

 

Administration

  • Environment Manager: Die Administration der SAS Viya Umgebung erfolgt über den Environment Manager, eine Webanwendung zur Verwaltung von Daten, Benutzerinhalten, Benutzerinformationen, Lizenzen, System-Backups, Konfigurationen, Compute Contexts, Logs, Recheneinheiten, Passwörtern, mobilen Zugriff und Benutzerregeln. 
  • CAS-Monitor: Der CAS-Monitor ermöglicht Administratoren die Konfiguration des CAS-Servers, das Anzeigen von Startoptionen und Umgebungsvariablen sowie das Hinzufügen und Entfernen aktiver CAS-Nodes. Außerdem können Informationen über Benutzersitzungen abgerufen, abgebrochen und beendet werden. 

Data Sources

SAS Viya unterstützt eine Vielzahl von Datenquellen, darunter gängige Datenformate wie CSV oder SAS-Datasets sowie Datenbanken wie Hadoop Cluster, Snowflake oder Amazon Redshift. SAS stellt eine vollständige Liste der unterstützten Datenquellen zur Verfügung.  

 

Video: Von SAS 9 zu SAS Viya

Unser Berater Daniel Schulte hat auf unserem NAVIGATE Kongress 2023 den Vortrag "Von SAS 9 zu SAS Viya – Migrationspfade und Deep Dive" gehalten. Den Video-Mitschnitt des Talks finden Sie auf unserer NAVIGATE-Seite. Dort behandelt Daniel Schulte unter anderem die Frage wie es mit gewachsenen SAS Umgebungen in die neue Viya Welt geht.

 

Expert:innen für SAS Viya

Möchten Sie mehr über die Vorteile von SAS Viya erfahren oder interessieren Sie sich dafür, wie Sie Aufgaben und komplette Prozessketten mit SAS Viya automatisieren können? Steht Ihnen eine Migration von SAS 9.4 zu SAS Viya bevor? Besuchen Sie unseren Blog und unseren Data Science-Bereich oder sprechen Sie uns an für Informationen zu SAS Viya und erfahren Sie, wie Ihr Unternehmen von fortschrittlichen Analysetools profitieren kann. 

 


Zu diesem Blogartikel hat Pascal Lengersdorf mit seiner Tätigkeit als Werkstudent bei der viadee maßgeblich beigetragen. 


zurück zur Blogübersicht

Diese Beiträge könnten Sie ebenfalls interessieren

Keinen Beitrag verpassen – viadee Blog abonnieren

Jetzt Blog abonnieren!

Kommentare

Nils Quiring

Nils Quiring

Nils Quiring ist seit 2021 Berater bei der viadee Unternehmensberatung AG. Sein aktueller Schwerpunkt liegt im Bereich Business Intelligence, Data Warehousing und SAS-Entwicklung, besonders im Bereich Banken und Finanzdienstleister.

Nils Quiring auf LinkedIn