மனிதனால் உருவாக்கப்படும் செயற்கைத் தரவுகள்.. பயன்களும், பாதுகாப்பும்

உண்மையான மனிதர்கள் அல்லது நிகழ்வுகளின் தரவுகளைப் பிரதிபலித்தாலும், இதில் எந்தவொரு உண்மையான தனிப்பட்ட தகவல்களும் இருக்காது...
மனிதனால் உருவாக்கப்படும் செயற்கைத் தரவுகள்.. பயன்களும், பாதுகாப்பும்
Published on
Updated on
2 min read

செயற்கைத் தரவுகள் (Synthetic Data) என்பது இன்று தகவல் தொழில்நுட்பத் துறையில் (Information Technology) பெரும் விவாதப் பொருளாக இருக்கிறது. செயற்கைத் தரவுகள் என்பவை, நிஜ உலகத் தகவல்களைப் போலத் தோற்றம் அளிக்கும் வகையில், கணினி வழிமுறைகள் (Computer Algorithms) மூலம் கற்பனையாக உருவாக்கப்பட்ட தரவுகள் ஆகும். இவை, உண்மையான மனிதர்கள் அல்லது நிகழ்வுகளின் தரவுகளைப் பிரதிபலித்தாலும், இதில் எந்தவொரு உண்மையான தனிப்பட்ட தகவல்களும் (Personal Information) இருக்காது. இது, தரவுகளைப் பயன்படுத்தும் விதத்தில் ஒரு பெரிய மாற்றத்தைக் கொண்டுவர உள்ளது.

இந்தச் செயற்கைத் தரவுகளின் மிகப் பெரிய நன்மை, தனிநபர் தகவல் பாதுகாப்பை (Data Privacy) உறுதி செய்வதுதான். ஒரு நிறுவனத்திடம் மில்லியன் கணக்கான வாடிக்கையாளர்களின் முக்கியமான தகவல்கள் (உதாரணமாக: வங்கிப் பரிவர்த்தனை விவரங்கள், மருத்துவப் பதிவுகள்) இருக்கலாம். இந்தத் தகவல்களைப் பயன்படுத்திப் புதிய மென்பொருட்களை உருவாக்கவோ அல்லது செயற்கை நுண்ணறிவு (AI) மாதிரிகளுக்குப் பயிற்சி அளிக்கவோ வேண்டியிருக்கும்போது, உண்மையான தகவல்களைப் பயன்படுத்தினால், அது வாடிக்கையாளர்களின் பாதுகாப்பிற்கு அச்சுறுத்தலாகலாம்.

அதற்குப் பதிலாக, செயற்கைத் தரவுகளைப் பயன்படுத்தினால், தரவுகளின் வடிவமும், இயல்பும் அப்படியே இருக்கும். ஆனால், அதில் தனிப்பட்ட நபர்களின் அடையாளம் இருக்காது. இதனால், பாதுகாப்புச் சட்டம் மீறப்படாமல், புதிய தொழில்நுட்பங்களை உருவாக்க முடியும்.

செயற்கைத் தரவுகள், அரிய நிகழ்வுகளுக்குப் (Rare Events) பயிற்சி அளிக்கப் பயன்படுத்தப்படுகின்றன. உதாரணமாக, மருத்துவத் துறையில் ஒரு மிக அரிய வகை நோயின் தரவுகள் குறைவாகவே இருக்கலாம். ஆனால், இந்த நோயின் குணாதிசயங்களைப் போலவே, செயற்கையாகப் பல லட்சம் தரவுகளை உருவாக்க முடியும். இந்தத் தரவுகளைக் கொண்டு AI மாதிரிகளுக்குப் பயிற்சி அளிப்பதன் மூலம், அந்த அரிய நோயைக் கண்டறியும் திறனை மேம்படுத்தலாம். நிதித் துறையில், இது மோசடி (Fraud) போன்ற அரிய குற்றங்களைக் கண்டறியும் கருவிகளை உருவாக்க உதவுகிறது. மேலும், இது நிஜமான தரவுகளைச் சேகரிக்கும் நேரத்தையும், செலவையும் வெகுவாகக் குறைக்கிறது.

இருப்பினும், இந்தச் செயற்கைத் தரவுகளைப் பயன்படுத்துவதில் சில சவால்கள் உள்ளன. முதலாவதாக, செயற்கைத் தரவுகள் நிஜ உலகத் தரவுகளைப் போலவே துல்லியமாகப் (Accurate) பிரதிபலிக்கிறதா என்பதை உறுதி செய்ய வேண்டும். சரியாக உருவாக்கப்படாத செயற்கைத் தரவுகள் மூலம் பயிற்சி அளிக்கப்பட்ட AI மாதிரிகள், நிஜ உலகில் தவறான முடிவுகளை எடுக்கக்கூடும். இரண்டாவதாக, அதிநவீன கணினி வழிமுறைகளைப் (Advanced Algorithms) பயன்படுத்தி, இந்தச் செயற்கைத் தரவுகளில் இருந்து மீண்டும் உண்மையான தனிநபரின் தகவல்களைக் கண்டறிய முடியுமா என்ற பாதுகாப்புச் சவாலும் உள்ளது.

இந்த அபாயங்களைக் கையாள, செயற்கைத் தரவுகளை உருவாக்கும் முறைகளைத் தொடர்ந்து மேம்படுத்துவதும், கடுமையான பாதுகாப்பு நெறிமுறைகளைப் (Security Protocols) பின்பற்றுவதும் அவசியம். சரியான முறையில் பயன்படுத்தப்பட்டால், செயற்கைத் தரவுகள் தகவல் தொழில்நுட்பத் துறையின் வளர்ச்சிக்கு மிகவும் உதவும்.

உள்ளூர் முதல் உலகம் வரை பரபரப்பான ஹாட் செய்திகளை உடனுக்குடன் அறிய மாலைமுரசு யூடியூப் சேனலை காண இங்கே கிளிக் செய்யவும்.

logo
Malaimurasu Seithikal
www.malaimurasu.com