

இன்றைய டெக்னாலஜி உலகில் மிகவும் டிமாண்ட் உள்ள துறைகளில் ஒன்றாக Data Science உருவெடுத்துள்ளது. ஐடி துறையில் நுழைய நினைப்பவர்களுக்கும், கைநிறைய சம்பளம் வாங்க விரும்புபவர்களுக்கும் இது ஒரு பொற்காலமாகும். ஆனால், இந்தத் துறையில் வெற்றி பெறுவதற்கு சரியான திட்டமிடல் மிக அவசியம். பலரும் சில மாதங்களிலேயே அனைத்தையும் கற்றுவிடலாம் என்று நினைக்கிறார்கள், ஆனால் ஒரு தேர்ந்த Data Scientist ஆக மாறுவதற்கு சுமார் 12 முதல் 20 மாதங்கள் வரை பொறுமையாகப் பயிற்சி செய்வது அவசியம் என்று வல்லுநர்கள் கூறுகிறார்கள்.
இந்த நீண்ட பயணத்தின் முதல் கட்டமாக, முதல் இரண்டு மாதங்களை Programming மற்றும் பதிப்புக் கட்டுப்பாட்டு முறைகளுக்காக (Version Control) ஒதுக்க வேண்டும். குறிப்பாக Python போன்ற எளிமையான லாங்குவேஜ்களைக் கற்றுக்கொள்வது உங்கள் அடித்தளத்தை வலுவாக்கும். அதனுடன் Git மற்றும் GitHub போன்ற டூல்ஸ்களைப் பயன்படுத்துவதன் மூலம், நீங்கள் செய்யும் கோட்களை எப்படி மேனேஜ் செய்வது என்பதைத் தெரிந்து கொள்ளலாம். ஒரு கம்பெனியில் வேலைக்குச் சேரும்போது, தனிப்பட்ட முறையில் கோட் செய்வதை விட டீமாக வேலை செய்ய இந்தத் திறன்கள் மிக முக்கியம்.
அடுத்ததாக, ஒரு மாதம் முழுக்க Data Structures and Algorithms (DSA) பகுதிக்கு முக்கியத்துவம் கொடுக்க வேண்டும். டேட்டா சயின்ஸ் என்பது வெறும் டேட்டாவை கையாள்வது மட்டுமல்ல, சிக்கலான பிரச்சனைகளுக்கு எப்படி புத்திசாலித்தனமாகத் தீர்வு காண்பது என்பதும் இதில் அடங்கும். இந்த அடிப்படை அறிவை வளர்த்துக் கொண்ட பிறகு, கணிதத்தின் பக்கம் கவனம் செலுத்த வேண்டும். தரவு அறிவியலின் முதுகெலும்பாக இருப்பது Mathematics ஆகும். குறிப்பாக Linear Algebra, Calculus மற்றும் Statistics போன்ற பாடங்களை 3 முதல் 4 மாதங்கள் வரை ஆழமாகக் கற்க வேண்டும். புள்ளிவிவரங்கள் தெரியாமல் டேட்டாவை உங்களால் சரியாகப் பகுப்பாய்வு செய்ய முடியாது.
ஐந்தாவது கட்டமாக, டேட்டாவை சேமித்து வைக்க உதவும் Databases பற்றித் தெரிந்து கொள்ள வேண்டும். சுமார் 2 மாதங்கள் SQL மற்றும் NoSQL போன்ற டேட்டாபேஸ் மேனேஜ்மென்ட் சிஸ்டம்களைப் பயில வேண்டும். கம்பெனிகளில் உள்ள கோடிக்கணக்கான டேட்டாவிலிருந்து நமக்குத் தேவையானதை மட்டும் எப்படிப் பிரித்தெடுப்பது (Querying) என்பதை இதில் கற்றுக்கொள்ளலாம். அதன் பிறகு, அடுத்த 3 மாதங்களில் Data Analysis மற்றும் Visualization டூல்ஸ்களான Pandas, NumPy, Matplotlib மற்றும் Seaborn ஆகியவற்றைப் பயன்படுத்தி டேட்டாவிலிருந்து ஒரு அழகான கதையைச் சொல்லப் பழக வேண்டும்.
பத்தாவது மாதத்திலிருந்து மிகவும் முக்கியமான Machine Learning பகுதி தொடங்குகிறது. இதற்கு குறைந்தது 4 முதல் 5 மாதங்கள் தேவைப்படும். Scikit-learn போன்ற லைப்ரரிகளைப் பயன்படுத்தி மாடல்களை உருவாக்குவது, தியரி மற்றும் பிராக்டிகல் என இரண்டிலும் வலுவாக இருப்பது உங்களை மற்றவர்களிடமிருந்து தனித்துக் காட்டும். இதன்பிறகு, Deep Learning, Natural Language Processing (NLP) அல்லது Computer Vision போன்ற ஏதேனும் ஒரு ஸ்பெஷலைசேஷனைத் தேர்வு செய்து 2 மாதங்கள் அதில் நிபுணத்துவம் பெறலாம்.
இறுதி மாதங்களில், நீங்கள் கற்ற அனைத்தையும் ஒருங்கிணைத்து சில ரியல்-டைம் ப்ராஜெக்ட்களை (Projects) உருவாக்க வேண்டும். உங்கள் போர்ட்ஃபோலியோவை (Portfolio) வலுவாக்க இது உதவும். வெறும் படிப்போடு நிறுத்தாமல், இன்டர்வியூக்களுக்குத் தயாராவது, லிங்க்ட்-இன் (LinkedIn) போன்ற தளங்களில் நெட்வொர்க்கிங் செய்வது என 20 மாதங்கள் கழித்து ஒரு முழுமையான டேட்டா சயின்டிஸ்ட்டாக நீங்கள் களமிறங்கலாம். இந்த நீண்ட கால உழைப்பு நிச்சயம் உங்கள் கரியரில் ஒரு பெரிய மாற்றத்தை ஏற்படுத்தும்.
உள்ளூர் முதல் உலகம் வரை பரபரப்பான ஹாட் செய்திகளை உடனுக்குடன் அறிய மாலைமுரசு யூடியூப் சேனலை காண இங்கே கிளிக் செய்யவும்.