Nyelvében él

Ha az ember valamilyen új szakterületbe próbálja meg beásni magát, nyelvet is kell tanulnia. Emlékszem például az iskolai biológia órákra: rengeteg növény- és állatnevet kellet bevágni. A matematikánk is megvan a maga nyelve, a történelemnek is. Most éppen az adattudomány nyelvével ismerkedem.

Az iskola, ahol tanítok, a jövő évben „data science” mesterprogram indítását tervezi. Ez számomra is feladatokat jelent, éppen ezért hozzáláttam a terület nyelvének megismeréséhez. A program angol nyelven fut majd, ezért én is angol nyelven dolgozom. Szavakat, szókapcsolatokat, fél- és egész mondatokat jegyzek fel. Íme, itt van egy válogatás a jegyzeteimből, a bővülő anyagból véletlenszerűen szemezgetve:

(envisioning the problem) (applying data science technologies) (deploying the results to improve decision-making) (multidisciplinary data science) (exploiting data for competitive advantage) (volume and variety) (data science principles and data-mining techniques) (targeted marketing, maintenance, teaching, etc.) (understand customer behavior) (maximize value) (recommendations) (scoring) (fraud detection) (view business problems from data perspective) (extracting knowledge from data) (smart weather forecasting) (predicting instead of waiting for something to happen) (discover patters) (predict, prevent customer churn) (data science: principles+processes+techniques) (data-driven decison-making) (instead of intuition) (where small increases may make a difference) (finding indicators) (predictive models) (most intense application: direct marketing, online advertising, credit scoring, financial trading, help-desk, fraud detection) (data engineering, data processing) (Big Data 1.0) (view data as a business asset) (data sets that are too large for traditional data processing systems) (assess whether and how data can improve performance) (structured thinking about analytics) (the engineering side of data science) (open architecture for doing highly parallelizable computations) (decompose a problem into subtasks) (matching with tools available) (classification and class probability estimation) (probability, likelihood) (estimate the numerical value of some variable) ( similarity matching) (finding natural groups, segments) (co-occurence grouping) (profiling) (anomaly detection) (link prediction) (data reduction) (causal modeling) (automated search for knowledge, patterns and regularities) (randomized controlled experiments) (supervised and unsupervised tasks) (target variable) (consistency, repeatability, objectiveness) (cross industry standard process for data mining) (creative problem formulation) (decomposing a problem into data mining tasks) (the strengths and limitations of data) (costs and benefits of data sources) (data preparation phase, data understanding, data conversion) (testing validation, evaluation) (avoid false alarms) (spam detection) intrusion monitoring) (do more good than harm) (ill-structured problems)

Hozzászólás írása

Hiba az űrlap kitöltése során!

* A csillaggal jelölt mezők kitöltése kötelező

*
*
*
*