Datu zinātnieki: Tehnoloģiju pasaules jaunās roka zvaigznes

Autors: Robert Simon
Radīšanas Datums: 24 Jūnijs 2021
Atjaunināšanas Datums: 1 Jūlijs 2024
Anonim
CS50 2014 - Week 9, continued
Video: CS50 2014 - Week 9, continued

Saturs


Avots: Onradio / iStockphoto

Izņemšana:

Datu zinātnieka loma strauji kļūst par vispieprasītāko tehnoloģiju pasaules karjeru. Mēs jautājām izcilākajam datu zinātniekam Džeikam Porvejam no The New York Times par to, kā viņš ieguva darbu, un viņa padomus, kā gūt panākumus šajā jomā.

Datu zinātnieka loma strauji kļūst par vispieprasītāko karjeru tehnoloģiju pasaulē. Uzņēmumi, piemēram, Google, Amazon un LinkedIn, izmanto datu zinātniekus, lai palīdzētu viņiem saglabāt šo novatorisko priekšrocību digitālo datu laikmetā. Un tagad datu un tehnoloģiju entuziasti vēlas kļūt par datu zinātniekiem tāpat, kā daži mūziķi tiecas kļūt par roka zvaigznēm. Varbūt tas ir iemesls, kāpēc daži cilvēki datu zinātniekus dēvē par tehnoloģiju laikmeta jaunajām klinšu zvaigznēm.

Diemžēl šī loma joprojām ir tik jauna, ka joprojām tā ir neskaidra, kas nozīmē, ka daudzi zinātniski pētnieki, kuri vēlas zināt datus, brauc ar saviem ceļojuma autobusiem pa nepareizo ceļu. Vai datu zinātnieki ir pelnījuši savu rokzvaigžņu reputāciju? Mēs ienirām datu zinātnes pasaulē ar interviju ar Džeiku Porveju, datu zinātnieku no R&D laboratorijas laikrakstā The New York Times.


Datu zinātnieki: Techs Rock Stars?

Tad kāpēc datu zinātnieki tiek dēvēti par jaunajām tehnoloģiju pasaules klinšu zvaigznēm? Šī analoģija faktiski ir dziļāka nekā datu nerds vēlme izklausīties pēc ultraviles. Tāpat kā rokzvaigzne, datu zinātnieku karjera ietver daudzveidību, māksliniecisko brīvību un pielāgošanās spējas. Un tāpat kā izklaides pasaules rokzvaigznes, labākie datu zinātnieki mēdz iegūt diezgan daudz cilvēku no visām datu un tehnoloģiju nozares jomām.

Tas, ko dara datu zinātnieks, ir ļoti daudzveidīgs; tāpat kā mūziķi izmanto dažādus instrumentus, instrumentus un paņēmienus, lai atskaņotu tikpat atšķirīgus mūzikas stilus kā džezs un death metal, arī datu zinātnieks apgūst noteiktu instrumentu un jomu. Ir iesaistīts arī to stils. Un arī nav pareiza vai nepareiza darba veikšanas veida - tas attiecas uz darba ietekmi uz citiem cilvēkiem.

Kad Bītli rakstīja savas dziesmas, nebija tikai viens cilvēks, kurš diktēja, kā jāspēlē katra instrumenta katra piezīme. Viņi sanāca kopā un iestrēga; radoši atklājot, viņi atrada dziesmas, kas darbojās. Tas pats attiecas uz datu zinātniekiem. Viņiem ir jājūt ritms, jāiejūtas rievā un jāsaskaņo risinājums. Tas ir iespējams tikai tad, ja ir pietiekama mākslinieciskā brīvība izmēģināt jebkuras pieejas, rīkus un paņēmienus, kas jums varētu ienākt prātā, un spēja veikt izmaiņas, kad kaut kas šķiet ārpus atslēgas.


Kad datu zinātnieks apgūst galvenos pamatus, viņš / viņa kļūst pielāgojams un iegūst pārliecību piedāvāt risinājumus citās jomās. Vairāk par šiem pamatprincipiem mēs runājam vēlāk. Šeit jāuzsver tas, ka, apgūstot datu zinātni, jūs varat uzņemties lomu jebkurā jomā, kuru vēlaties, jo dati ir visur.

Datu zinātnieka galvenais mērķis ir radīt milzīgas vērtības lielākai cilvēku skaitam. Kamēr datu zinātnieks strādā aizkulisēs, tas neatšķiras no spēles lielai auditorijai: jo labāk jūs darāt darbu, jo vairāk cilvēku jūs sasniedzat - un jo vairāk atlīdzību jūs redzat.

Datu zinātnieki dara ko?

Ko tad precīzi dara datu zinātnieki? Apskatīsim šo piemēru, ar kuru mēs visi varētu būt saistīti.

Bez kļūdām, bez stresa - jūsu soli pa solim, kā izveidot programmatūru, kas maina dzīvi, neiznīcinot savu dzīvi

Jūs nevarat uzlabot savas programmēšanas prasmes, kad nevienam nerūp programmatūras kvalitāte.

Pieņemsim, ka jūs kādu dienu saprotat, ka tajā dienā jums nav tik daudz enerģijas, kā jūs agrāk. Tātad jūs izvirzījāt sev mērķi: dienas laikā iegūt vairāk enerģijas. Tagad tas ir diezgan plašs un neviennozīmīgs mērķis. Pirmais datu zinātnieka solis ir novērst šo neskaidrību un kvantitatīvi noteikt šo mērķu izmērāmību. Tam ir metodes. Mēs šeit parasti neiedziļināsimies detaļās, bet tikai sakām, ka jūs domājat, ka nesaņemat pietiekami daudz miega, un tāpēc piešķiriet sev apakšmērķi - katru vakaru iegūt astoņas stundas miega.

Kaut arī šis mērķis ir nedaudz izmērāmāks un mazāk divdomīgs, tam ir savi izaicinājumi. Jūs tiešām nevarat iedarbināt taimeri, kad aizmigāt, un pat ja jūs ieslēdzat taimeri pēc tam, kad esat ielēcis gultā, iespējams, ka jūs uzreiz aizmigsit. Turklāt ir grūti uzskaitīt laikus, kad pamodāties nakts vidū. Visbeidzot, ir dažādi miega veidi, piemēram, dziļš miegs un viegls miegs. Galvenais ir tas, ka ir grūti precīzi izmērīt miegu, un tāpēc vēl grūtāk ir izmērīt tā ietekmi uz jūsu enerģijas līmeni.

Ko jūs varat darīt? Tā kā datu zinātnieks meklē jaunākās tehnoloģijas un atklāj, ka ir miega uzraudzības ierīces.Un, ja jūs izmantojāt šādu ierīci miega mērīšanai un digitālai reģistrēšanai, tad varēsit iegūt precīzākus datus par miegu un laika gaitā tos apkopot, lai izveidotu diagrammu.

Tas vien var dot jums labāku ieskatu notiekošajā. Vizuālais attēlojums sniegs jums izpratni, skaidrību un virzienu. Jūs varēsit redzēt, vai jūs sasniedzat mērķi - astoņas miega stundas naktī - un, kas ir vēl svarīgāk, varēsit rīkoties, ja neesat.

Šis ir datu zinātnieka pamatdarbs: radīt jaunus datu mērīšanas un parādīšanas veidus, lai tiem, kas to aplūko, būtu lielāka izpratne, skaidrība un virzība.

Bet labs datu zinātnieks ar to neapstājas. Kad dati ir savākti, tos var integrēt ar jebkuru citu izmērītu darbību, ko veicat visu dienu. Integrējiet to ar savu produktivitāti, pamatojoties uz datiem no jūsu uzdevumu pārvaldības sistēmas. Integrējiet to ar savām noskaņām, pamatojoties uz tweets un statusa atjauninājumiem. Integrējiet to ar savu veselību, pamatojoties uz sporta zāles apmeklējumu vai svara zaudēšanu. Ņemot vērā jau pieejamo datu daudzumu un iespēju tos viegli tvert, iespējas ir bezgalīgas.

Kā būt datu zinātniekam

Vai jūs interesē datu zinātnes karjera? Tā kā datu zinātne ir tik jauna, mēs lūdzām labāko datu zinātnieku ieskatu šajā jomā. Džeiks Porvejs ir The New York Times datu zinātnieks un DataKind (sākotnēji pazīstams kā Data Without Borders) dibinātājs, kas bezpeļņas organizācijām, kurām nepieciešama datu zinātne, sakrīt ar ārštata un pro-bono datu zinātniekiem. Porvejam ir datorzinātņu fons un doktora grāds. statistikā no UCLA. Šeit ir teikts par to, kā iedziļināties datu zinātnē, kā labi strādāt un kā izvairīties no galvenajām kļūdām šajā jomā.

1. Iegūstiet pareizās prasmes

Pēc Porveja teiktā, nokļūšana uz lauka ir saistīta ar trim galvenajām lietām:

  • Praktiskas skaitļošanas prasmes
  • Statistiskās prasmes
  • Vēlme mācīties

"Jums jāprot rakstīt skriptus, lai nokasītu datus, kā arī kodētu algoritmus, ar kuriem jūs saskaraties galvā," saka Porvejs. "Jums vajadzētu zināt savu pamata statistiku (un ideālā gadījumā vairāk), ja jūs tiešām varēsit novērtēt, vai jūsu veidotie modeļi vai jūsu rakstītie algoritmi dara to, ko vēlaties."

2. Veiciet savienojumus

Pirms pievienošanās The New York Times R&D laboratorijai Porvejs strādāja mašīnmācībā un datora redzēšanā, kā arī pavadīja daudz laika, iegūstot robotus, lai identificētu mīnas un lidmašīnas (cik forši ir ka?). Līdz brīdim, kad viņš uzsāka darbu The New York Times, viņš izvērsās plašākos datu zinātnes uzdevumos, proti, Project Cascade, kas izseko saites no publikācijas visos sociālajos medijos.

Porvejs saka, ka vissvarīgākais, lai nokļūtu laukumā, ir iegūt mācības.

"Dodieties uz datu zinātnes projektu!" Porvejs saka. "Lejupielādējiet dažus datus, paņemiet R un sāciet spēlēt ... Es gribētu teikt, ka koncentrējieties uz kaut ko līdzīgu R izmantošanai līdztekus statistikas pamata grāmatai, lai palīdzētu jums izpētīt dažus datus. Mašīnmācīšanās un skaitļošanas prasmes nāks kopā ar to (no protams, tas ir atkarīgs no jūsu iepriekšējās pieredzes - ja jau esat statists, paņemiet kādu Python!) "

Tad ir pienācis laiks izveidot dažus savienojumus. Porvijs iesaka vietējo meetup grupu - jo dalība datu zinātnes kopienā ir "ātrākais veids, kā uzzināt to, ko jūs nezināt." Un tas ir svarīgi jomā, kas pastāvīgi attīstās.

3. Ienāc spēlē

Porvejam ir doktora grāds UCLA statistikā, bet viņš uzsver, ka labs darbs jums nav vajadzīgs.

"Tas varētu palīdzēt, bet nedomājiet, ka jums ir jādodas prom un jāveic vēl pieci skolas gadi, lai varētu sevi saukt par datu zinātnieku," sacīja Porvejs.

Datu zinātne ir salīdzinoši jauna joma. Tas nozīmē, ka tiem, kas vēlas iekļūt laukā, tam ir jāpieiet ar atvērtu prātu.

"Foursquare datu zinātnieks izskatīsies daudz savādāk nekā Goldman Sachs datu zinātnieks," saka Porvejs.

4. Nosvini savu jauno lomu

Datu zinātnes mērķis ir noskaidrot mērķus, pārbaudīt pieņēmumus, novērtēt pierādījumus un novērtēt secinājumus. Bet tas ir viens mazs mīklas gabals, ko daudzi cilvēki aizmirst. Vai varat uzminēt, kas tas ir? Pēc Porveja teiktā, slepenā sastāvdaļa ir kritiskā domāšana.

"Man tiešām hakeri atšķir no patiesajiem zinātniekiem," saka Porvejs. "Jūs būsit pārsteigts, cik reizes esmu redzējis, ka kāds veido modeli un ziņo par rezultātiem, nemaz nenojaušot, ka viņi nav kritiski domājuši par to, no kurienes nāk dati, vai arī par to, ka viņu eksperiments tika izstrādāts pareizi. Jums ir jāprot apšaubīt katru darbību. jūsu procesu un katru numuru, ar kuru jūs nākt klajā. "

Ceļš uz lieliem datiem

Pornvejs saka, ka, kad viņš saprata spēju izmantot milzīgu datu daudzumu, lai mašīnas iemācītu sevi, tas viņam prātā ienāca. Tā aizraušanās - un viņa izglītība un prasmes - palīdzēja viņam kļūt par galveno darbu datu zinātnē. Ja vēlaties sakopot lielos datus, nometiet dažas grāmatas, lejupielādējiet dažus datus un sāciet spēlēt. Jūs nekad nezināt, kāds būs neapstrādātu datu kopums.

Lai iegūtu pilnu intervijas atšifrējumu, dodieties uz vietni DataScientists.Net.