Hadoop izplatītā failu sistēma (HDFS)

Autors: Judy Howell
Radīšanas Datums: 28 Jūlijs 2021
Atjaunināšanas Datums: 1 Jūlijs 2024
Anonim
What is HDFS | Hadoop Distributed File System (HDFS) Introduction | Hadoop Training | Edureka
Video: What is HDFS | Hadoop Distributed File System (HDFS) Introduction | Hadoop Training | Edureka

Saturs

Definīcija - ko nozīmē Hadoop izplatītā failu sistēma (HDFS)?

Hadoop izplatītā failu sistēma (HDFS) ir izplatīta failu sistēma, kas darbojas ar standarta vai zemas klases aparatūru. Apache Hadoop izstrādātais HDFS darbojas kā standarta izkliedētā failu sistēma, bet nodrošina labāku datu caurlaidspēju un piekļuvi caur MapReduce algoritmu, augstu kļūdu toleranci un lielu datu kopu dabisko atbalstu.


Ievads Microsoft Azure un Microsoft Cloud | Šajā rokasgrāmatā jūs uzzināsit, kas ir mākonis skaitļošana un kā Microsoft Azure var palīdzēt jums migrēt un vadīt savu biznesu no mākoņa.

Techopedia skaidro Hadoop izplatīto failu sistēmu (HDFS)

HDFS glabā lielu daudzumu datu, kas izvietoti vairākās mašīnās, parasti simtos un tūkstošos vienlaicīgi savienotu mezglu, un nodrošina datu ticamību, replicējot katru datu gadījumu kā trīs dažādas kopijas - divas vienā grupā un vienu otrā. Kļūmes gadījumā šīs kopijas var aizstāt.

HDFS arhitektūra sastāv no klasteriem, no kuriem katram var piekļūt, izmantojot vienu programmatūras rīku NameNode, kas instalēts atsevišķā mašīnā, lai pārraudzītu un pārvaldītu šo klasteru failu sistēmu un lietotāja piekļuves mehānismu. Pārējās mašīnas instalē vienu DataNode gadījumu, lai pārvaldītu klasteru krātuvi.

Tā kā HDFS ir rakstīts Java, tam ir vietējs Java lietojumprogrammu saskarņu (API) atbalsts programmu integrācijai un pieejamībai. Tam var piekļūt arī caur standarta Web pārlūkprogrammām.