Apache cūka

Autors: Robert Simon
Radīšanas Datums: 16 Jūnijs 2021
Atjaunināšanas Datums: 13 Maijs 2024
Anonim
cuka hotel california
Video: cuka hotel california

Saturs

Definīcija - ko nozīmē Apache Pig?

Apache Pig ir platforma, kuru izmanto lielu datu kopu analīzei. To veido augsta līmeņa valoda datu analīzes programmu izteikšanai, kā arī infrastruktūra šo programmu novērtēšanai. Viena no nozīmīgākajām Cūkas iezīmēm ir tā, ka tās struktūra reaģē uz ievērojamu paralizēšanu.


Cūka darbojas Hadoop platformā, ierakstot datus Hadoop izplatītajā failu sistēmā (HDFS) un nolasot datus no tām un veicot apstrādi, izmantojot vienu vai vairākus MapReduce darbus. Apache Pig ir pieejams kā atvērts avots.

Apache Pig ir arī pazīstams kā Cūku programmēšanas valoda vai Hadoop Pig.

Ievads Microsoft Azure un Microsoft Cloud | Šajā rokasgrāmatā jūs uzzināsit, kas ir mākonis skaitļošana un kā Microsoft Azure var palīdzēt jums migrēt un vadīt savu biznesu no mākoņa.

Techopedia skaidro Apache Pig

Apache Pig ir divas daļas: Pig latīņu valoda un Pig dzinējs. Cūku latīņu valoda ir skriptu valoda, kas lietotājiem ļauj parādīt veidu, kādā jālasa un jāapstrādā datu plūsma no vienas vai vairākām ieejām, kā arī vieta, kurā tie jāuzglabā.

Dažas no galvenajām cūku latīņu īpašībām ir šādas:

  • Viegli programmējams: sarežģīti uzdevumi, kas sastāv no dažādām savstarpēji savienotām datu pārvērtībām, ir skaidri kodēti kā datu plūsmas secības. Tas padara tos vienkārši rakstīt, saprast un uzturēt.
  • Optimizācijas iespējas: uzdevumu kodēšanas veids ļauj sistēmai optimizēt automātisko izpildi. Tas ļauj lietotājam efektivitātes vietā pievērst uzmanību semantikai.
  • Paplašināmība: lietotājiem ir atļauts izveidot savas funkcijas mērķa apstrādes veikšanai. Cūku dzinējs ir atbildīgs par cūku latīņu valodā rakstītās datu plūsmas izpildi. Līdzīgi kā standarta relāciju datu bāzes pārvaldības sistēmas (RDBMS) dizains, Apache Pig sastāv no parsētāja, optimizētāja un tipa pārbaudītāja, papildus operatoriem, kuri veic datu apstrādi. Cūka neietver darījumus, datu katalogu vai iespēju tieši rīkoties ar datu glabāšanu vai izmantot izpildes ietvaru.