Data engineering

A kategória szakmai hitelesítője a(z) MSCI.

Technológia

  • adat infrastruktúra
  • batch/streaming feldolgozás
  • CDC
  • Core Pyton
  • data science/engineering library
  • networkx
  • numpy
  • pandas
  • sklearn
  • upsert

Nyeremény

  • 1.helyezett: 150 000 Ft
  • 2.helyezett: 80 000 Ft
  • 3.helyezett: 50 000 Ft
  • Női különdíj: 150 000 Ft
Az 5 forduló olyan fontos területeket fed le, amelyek a data engineering területen sokszor kerülnek elő, ezen belül minden egyes részterület megjelentik az MSCI által végzett munkában. Az idősor analízis minden pénzügyi szolgáltató cégnél az alfája és ómegája az adatelemzésnek, legyen az pénzpiaci termékek leíró adata vagy rendszer-telemetria vagy viselkedés dinamika. A kategorizálás, csoportok kezelése, szegmentáció és binning mind a kliensek kiszolgálásának, mind új problémák megértésének alapvető eszköze, amelyhez értő kézzel kell hozzányúlni.
A természetes nyelvi feldolgozás az elmúlt 3 év nagy slágere, de az MSCI-nál az LLM-ek globális sikersztorija előtt is már komoly erőfeszítések folytak a kutatók és ESG alkalmazásfejlesztők területein a nagy szövegtestek hatékony feldolgozására. A Real Assets területen a geospatial elemzés és modellezés szintén az alapvetése minden helyinformációt figyelembe vevő kockázatelemzésnek. A gráf alapú modellezés pedig minden olyan területen újra és újra előkerül, ahol a relációs adatmodellek rosszul teljesítenek, és a relációk mellett vagy elsősorban a kapcsolatok és hierarchiák jelentik az adott probléma megoldásának kulcsát.

A feladatokat jó szívvel ajánljuk minden olyan fejlesztőnek, akik az adatelemzésben, adatstruktúrák kezelésében, feature engineeringben járatosak, vagy ezen feladatokon keresztül szeretnének kedvet kapni egy adott területhez.

Mivel foglalkozik az MSCI, a kategória szakmai hitelesítője?

Az MSCI, a pénzügyi világ egyik utolsó független Index szolgáltatója, három nagy szegmensben működünk:

  • Index üzletág: az általunk számolt indexek a világ tőzsdéin viszonyítási alapként működnek. Közel 12,1 billió dollárnyi részvény van a cég indexeihez mérve, napi szinten 200 000-nél is több indexet kalkulálunk.
  • Risk management üzletág: a cég legfőbb feladata ezen a területen, hogy nagyon részletes, komplex és megbízható képet adjon az egyes befektetések rizikó tartalmáról. Ennek kapcsán mindkét ismertebb rizikó-értékelési metódus kifejezetten a cég nevéhez kapcsolódik: a RiskMetrics metodológia a portfoliók VaR számításhoz, illetve a Barra faktor rizikó-analitika.
  • ESG üzletág (Environmental, Social and Governance): Elkezdtük mérni, hogy egy adott vállalat milyen környezeti, szociális hatást gyakorol a működése során, illetve milyen átláthatóság mellett működik, ehhez pedig a hitelminősítőkhöz hasonló értékeléseket (ratingeket) adunk ki. Az elkövetkezendő években nagy valószínűséggel még ismertebbé válunk ezen a területen, hiszen mutatóink iparági standarddá váltak a fenntarthatóság mérésében és árazásában.

Mivel várunk a kategóriában?

  1. Idősorok kezelése
  2. Kategorikus változók kezelése, folyamatos változók kategorikussá tétele, binningje, dimenziócsökkentés
  3. Természetes nyelvi feldolgozás és reguláris kifejezések
  4. Spatial data elemzés, geometriák
  5. Gráfok használata

Mind az 5 forduló 1-2 elméleti kis feladatból és egy nagy gyakorlatibb feladatból áll. 

Kit várunk a kategóriában?

A feladatokat jó szívvel ajánljuk minden olyan fejlesztőnek, akik az adatelemzésben, adatstruktúrák kezelésében, feature engineeringben járatosak, vagy ezen feladatokon keresztül szeretnének kedvet kapni egy adott területhez.

Szükség lesz-e előzetesen egy megadott környezet "felépítésére" a versenyhez?

Nem, az összes feladat megoldható egy laptopon, a feladatok kapcsán meg van jelölve az adatforrás, azt érdemes előre letölteni.

2024-es partnereink

Akik nélkül nem menne