Apache Spark


Eigenschappen

VoorkeurslabelApache Spark
DefinitieApache Spark is een open-source unified analytics-engine voor grootschalige gegevensverwerking.
SynoniemSpark
Toelichting op definitieSpark biedt een interface voor het programmeren van volledige clusters met impliciete dataparallellisme en fouttolerantie . Oorspronkelijk ontwikkeld aan de Universiteit van Californië, Berkeley 's AMPLab , werd de Spark- codebase later geschonken aan de Apache Software Foundation , die deze sindsdien heeft onderhouden.


Apache Spark heeft zijn architecturale basis in de veerkrachtige gedistribueerde dataset (RDD), een alleen-lezen multiset van data-items verdeeld over een cluster van machines, die op een fouttolerante manier wordt onderhouden. De Dataframe API werd uitgebracht als een abstractie bovenop de RDD, gevolgd door de Dataset API.
Exacte overeenkomsthttps://en.wikipedia.org/wiki/Apache_Spark
Afbeelding van250px-Apache_Spark_logo.svg.png
Video van
StatusConcept

Relaties

VertrekpuntRelatieEindpunten
Apache SparkBreder
Apache SparkBron van
Apache SparkGerelateerd

Afgeleide relaties

VertrekpuntRelatieEindpunt
Rdf.jpg