Google DeepMind වෙතින් RT-2: මෙම දෘශ්‍ය-භාෂා-ක්‍රියාකාරී ආකෘතිය රොබෝ ඉගෙනීම පරිවර්තනය කරන්නේ කෙසේද?
AIරොබෝ තාක්ෂණයයන්ත්‍ර ඉගෙනීමVLA ආකෘතිDeepMindටෙලිඔපරේටර් පුහුණුව

Google DeepMind වෙතින් RT-2: මෙම දෘශ්‍ය-භාෂා-ක්‍රියාකාරී ආකෘතිය රොබෝ ඉගෙනීම පරිවර්තනය කරන්නේ කෙසේද?

AY Robots පර්යේෂණDecember 24, 2025විනාඩි 8 ක කියවීමක්

Google හි RT-2 දෘශ්‍ය-භාෂා-ක්‍රියාකාරී (VLA) ආකෘතිය දෘශ්‍ය දත්ත, ස්වාභාවික භාෂාව සහ තත්‍ය කාලීන ක්‍රියා ඒකාබද්ධ කිරීමෙන් රොබෝ ඉගෙනීම නැවත සකස් කරන්නේ කෙසේදැයි සොයා බලන්න. මෙම නව්‍ය AI තාක්ෂණය ටෙලිඔපරේටර් සඳහා දත්ත රැස් කිරීම වැඩි දියුණු කරන අතර රොබෝ තාක්ෂණ යෙදුම්වල කාර්යක්ෂමතාව වැඩි කරයි. AY-Robots හි AI මඟින් මෙහෙයවනු ලබන රොබෝවරුන්ගේ අනාගතය කෙරෙහි එහි විභව බලපෑම ගවේෂණය කරන්න.

RT-2 වෙත හැඳින්වීම

Google DeepMind විසින් වැඩි දියුණු කරන ලද RT-2, රොබෝ තාක්ෂණය සඳහා AI හි සැලකිය යුතු දියුණුවක් සනිටුහන් කරන භූමි බිඳ හෙළන දෘශ්‍ය-භාෂා-ක්‍රියාකාරී (VLA) ආකෘතියකි. මෙම ආකෘතිය රොබෝවරුන්ට දෘශ්‍ය ආදාන සැකසීමට, ස්වාභාවික භාෂා විධාන තේරුම් ගැනීමට සහ නිරවද්‍ය ක්‍රියාත්මක කිරීමට හැකියාව ලබා දෙයි, එමඟින් ඩිජිටල් AI සහ භෞතික රොබෝ මෙහෙයුම් අතර බාධාවකින් තොර පාලමක් නිර්මාණය කරයි.

  • විශිෂ්ට ඉදිරි ගමනක් ලෙස, RT-2 රූප, පෙළ සහ ක්‍රියා විශාල දත්ත සමුදායන්ගෙන් ඉගෙන ගැනීමට පද්ධතිවලට ඉඩ දීමෙන් රොබෝ ඉගෙනීම වැඩි දියුණු කරයි, එමඟින් රොබෝවරුන්ට නව පරිසරයන්ට අනුවර්තනය වීම පහසු කරයි. නිදසුනක් ලෙස, AY-Robots වේදිකාවේදී, ටෙලිඔපරේටර්වලට RT-2 ආනුභාව ලත් ආකෘති භාවිතා කරමින් වස්තු හැසිරවීම වැනි කාර්යයන් සඳහා රොබෝවරුන් පුහුණු කළ හැකිය, එහිදී රොබෝවරයා වාචික උපදෙස් මත පදනම්ව අයිතම හඳුනා ගැනීමට සහ ලබා ගැනීමට ඉගෙන ගනී.
  • RT-2 පාරිසරික සංජානනය සඳහා දර්ශනය, විධාන අර්ථ නිරූපණය සඳහා භාෂාව සහ සැබෑ ලෝක ක්‍රියාත්මක කිරීම සඳහා ක්‍රියාව ඒකාබද්ධ කරයි, එමඟින් ඉගෙනීමේ කාර්යක්ෂමතාව වැඩි කරයි. ප්‍රායෝගික උදාහරණයක් වන්නේ ගබඩාවක ඇසුරුම් වර්ග කරන රොබෝවකි; එය අයිතම හඳුනා ගැනීමට දර්ශනය ද, වර්ග කිරීමේ නිර්ණායක තේරුම් ගැනීමට භාෂාව ද, ඒවා නිවැරදිව ස්ථානගත කිරීමට ක්‍රියාව ද භාවිතා කරයි, මේ සියල්ල AY-Robots වැනි වේදිකාවල දත්ත රැස් කිරීම හරහා විධිමත් කර ඇත.
  • AI ආකෘති සැබෑ ලෝක යෙදුම් සමඟ සම්බන්ධ කිරීමේදී, RT-2 පුහුණු කාලය අඩු කරමින්, අනුකරණය කරන ලද පරිසරයන්ගෙන් භෞතික රොබෝවරුන් වෙත දැනුම මාරු කිරීමට පහසුකම් සපයයි. AY-Robots හි, මෙයින් අදහස් කරන්නේ ටෙලිඔපරේටර්වලට දුරස්ථව උසස් තත්ත්වයේ පුහුණු දත්ත රැස් කළ හැකි අතර, එමඟින් අවම වෙබ් අඩවි ගැලපීම් සහිතව බාධක පිරුණු මාර්ගවල ගමන් කිරීම වැනි සංකීර්ණ කාර්යයන් කිරීමට රොබෝවරුන්ට හැකියාව ලැබේ.

දෘශ්‍ය-භාෂා-ක්‍රියාකාරී (VLA) ආකෘතියක් යනු කුමක්ද?

දෘශ්‍ය-භාෂා-ක්‍රියාකාරී (VLA) ආකෘතියක් යනු ප්‍රධාන සංරචක තුනක් ඒකාබද්ධ කරන උසස් AI ගෘහ නිර්මාණ ශිල්පයකි: දෘශ්‍ය දත්ත අර්ථ නිරූපණය කිරීම සඳහා දෘශ්‍ය සැකසුම්, පෙළ හෝ වාචික ආදාන තේරුම් ගැනීම සඳහා භාෂා අවබෝධය සහ භෞතික කාර්යයන් ඉටු කිරීම සඳහා ක්‍රියාත්මක කිරීම. මෙම පරිපූර්ණ ප්‍රවේශය රොබෝවරුන්ට බහුමාධ්‍ය දත්ත මත පදනම්ව තීරණ ගැනීමට ඉඩ සලසයි, එය බොහෝ විට එක් ආකාරයක ආදානයක් පමණක් හසුරුවන සාම්ප්‍රදායික AI ආකෘති අභිබවා යයි.

  • එහි හරය තුළ, RT-2 වැනි VLA ආකෘතියක් පරිගණක දර්ශනය හරහා රූප සැකසීමට, ස්වාභාවික භාෂා සැකසුම් හරහා භාෂාව විග්‍රහ කිරීමට සහ ශක්තිමත් කිරීමේ ඉගෙනීම හරහා ක්‍රියා ජනනය කිරීමට ස්නායුක ජාල භාවිතා කරයි. නිදසුනක් ලෙස, AY-Robots වේදිකාවේ රොබෝ පුහුණුවේදී, VLA ආකෘතියකට 'රතු ඇපල් ගෙඩිය ගන්න' වැනි විධානයක් ගෙන එය සොයා ගැනීමට දර්ශනය ද, උපදෙස් තහවුරු කිරීමට භාෂාව ද, එය ග්‍රහණය කර ගැනීමට ක්‍රියාව ද භාවිතා කළ හැකිය.
  • VLA ආකෘති විවිධ දත්ත මූලාශ්‍රවලින් අවසානය දක්වා ඉගෙනීමට ඉඩ දීමෙන් සාම්ප්‍රදායික AI වලින් වෙනස් වේ, ඒ වෙනුවට හුදකලා සැකසුම් සිදු කරයි. සාම්ප්‍රදායික ආකෘතිවලට දර්ශනය සහ භාෂාව සඳහා වෙනම මොඩියුල අවශ්‍ය විය හැකි අතර, එමඟින් අකාර්යක්ෂමතාවයට හේතු වේ, VLA වේගවත් අනුවර්තනය සඳහා ඒවා ඒකාබද්ධ කරයි. AY-Robots හි, මෙය ටෙලිඔපරේෂන් සැසිවලදී පැහැදිලි වන අතර එහිදී ක්‍රියාකරුවන් වස්තු හඳුනාගැනීමේදී ආලෝක තත්ත්වයන් වෙනස් කිරීම වැනි තත්‍ය කාලීන වෙනස්කම් හැසිරවීමට VLA ආකෘති පුහුණු කරන දත්ත රැස් කරයි.
  • රොබෝ පුහුණුව සහ දත්ත රැස් කිරීම සඳහා ක්‍රියාත්මක කිරීමේදී, VLA ආකෘති ස්වයංක්‍රීය රිය පැදවීම හෝ ශල්‍ය සහාය වැනි අවස්ථාවන්හිදී විශිෂ්ට වේ. නිදසුනක් ලෙස, AY-Robots භාවිතා කරමින්, ටෙලිඔපරේටර්වලට දුරස්ථව රොබෝ අතක් පාලනය කරමින් සියුම් කාර්යයන් ඉටු කළ හැකි අතර, VLA ආකෘතිය අනාගත ස්වයං පාලනය වැඩි දියුණු කිරීම සඳහා දත්ත වලින් ඉගෙන ගන්නා අතර, වැඩි දියුණු කළ කාර්ය සාධනය සඳහා ඉහළ විශ්වාසවන්ත පුහුණු දත්ත සමුදායන් සහතික කරයි.

RT-2 ක්‍රියා කරන ආකාරය: තාක්ෂණික බිඳවැටීම

RT-2 හි ගෘහ නිර්මාණ ශිල්පය ට්‍රාන්ස්ෆෝමර් පදනම් කරගත් පදනමක් මත ගොඩනගා ඇති අතර එමඟින් දෘශ්‍ය, භාෂා සහ ක්‍රියා ආදාන එකවර සැකසීමට ඉඩ සලසයි, එමඟින් රොබෝ පද්ධතිවල කාර්යක්ෂම ඉගෙනීම සහ තීරණ ගැනීම සිදු කරයි.

  • ප්‍රධාන යාන්ත්‍රණවලට දර්ශන සහ භාෂා දත්ත සඳහා බෙදාගත් කේතකය මෙන්ම ක්‍රියා අනුක්‍රම නිපදවන විකේතකයක් ද ඇතුළත් වේ. මෙම සැකසුම රොබෝ තාක්ෂණ දත්ත සමුදායන් මත හොඳින් සුසර කරන ලද පූර්ව පුහුණු ආකෘති උපයෝගී කර ගනිමින් සංකීර්ණ කාර්යයන් හැසිරවීමට RT-2 හට හැකියාව ලබා දෙයි, එය AY-Robots වැනි වේදිකා සඳහා වඩාත් සුදුසු වන අතර එහිදී දත්ත රැස් කිරීම ප්‍රධාන වේ.
  • ඒකාබද්ධ කිරීම සිදු වන්නේ ඒකාබද්ධ ස්නායුක ජාලයක් හරහා වන අතර එය දෘශ්‍ය සැකසුම් (උදා: කැමරා සංග්‍රහවලින් වස්තු හඳුනා ගැනීම), භාෂා අවබෝධය (උදා: පරිශීලක විධාන අර්ථ නිරූපණය කිරීම) සහ ක්‍රියාත්මක කිරීම (උදා: චලනය සඳහා මෝටර පාලනය කිරීම) ඒකාබද්ධ කරයි. AY-Robots හි ප්‍රායෝගික උදාහරණයක් වන්නේ කොටස් එකලස් කිරීමට රොබෝවක් පුහුණු කිරීමයි; ආකෘතිය සංරචක හඳුනා ගැනීමට දර්ශනය ද, එකලස් කිරීමේ උපදෙස් අනුගමනය කිරීමට භාෂාව ද, කාර්යය නිවැරදිව කිරීමට ක්‍රියාව ද භාවිතා කරයි.
  • RT-2 පුහුණු කිරීම සඳහා මහා පරිමාණ දත්ත රැස් කිරීම ඉතා වැදගත් වන අතර, සැබෑ ලෝක අන්තර්ක්‍රියා වලින් මිලියන ගණනක් උදාහරණ ඇතුළත් වේ. AY-Robots හි, ටෙලිඔපරේටර් සැසි වලදී විවරණය කරන ලද දත්ත සැපයීමෙන් දායක වන අතර, එය ආකෘතිය පිරිපහදු කිරීමට සහ එහි සාමාන්‍යකරණය වැඩි දියුණු කිරීමට උපකාරී වේ, එනම් පුළුල් පුහුණුවකින් තොරව නව වස්තූන්ට අනුවර්තනය වීමට රොබෝවරුන්ට ඉගැන්වීම වැනි දේ.

RT-2 සමඟ රොබෝ ඉගෙනීම විප්ලවීයකරණය කිරීම

RT-2 රොබෝවරු ඉගෙන ගන්නා සහ අනුවර්තනය වන ආකාරය පරිවර්තනය කරමින්, AI මඟින් මෙහෙයවනු ලබන රොබෝ තාක්ෂණයේ පෙර නොවූ විරූ මට්ටමේ නම්‍යශීලීභාවයක් සහ කාර්යක්ෂමතාවයක් ලබා දෙයි.

  • RT-2 නිරූපණ සහ නිවැරදි කිරීම් වලින් ඉක්මන් ඉගෙනීමට ඉඩ දීමෙන් රොබෝ අනුවර්තනය වැඩි දියුණු කරයි, ගතික පරිසරයන්හි තීරණ ගැනීම වැඩි දියුණු කරයි. නිදසුනක් ලෙස, නිෂ්පාදනයේදී, RT-2 භාවිතා කරන රොබෝවෙකුට AY-Robots හි ටෙලිඔපරේෂන් මෙවලම් හරහා රැස් කරන ලද තත්‍ය කාලීන දත්ත මත පදනම්ව එකලස් කිරීමේ රේඛා වෙනස්කම් වලට ගැලපේ.
  • ටෙලිඔපරේටර් උසස් තත්ත්වයේ දත්ත රැස් කිරීම විධිමත් කරන මෙවලම් වෙත ප්‍රවේශ වීමෙන් RT-2 වෙතින් ප්‍රතිලාභ ලබන අතර, දෝෂ අවම කර පුහුණු චක්‍ර වේගවත් කරයි. AY-Robots හි, මෙයින් අදහස් කරන්නේ ක්‍රියාකරුවන්ට දුරස්ථව කාර්යයන් හරහා රොබෝවරුන්ට මඟ පෙන්විය හැකි අතර, ආකෘතිය ස්වයංක්‍රීයව දත්ත ඒකාබද්ධ කරමින් හැසිරීම් පිරිපහදු කිරීමට, එනම් සියුම් වස්තු හැසිරවීම සඳහා ග්‍රහණ ශක්තිය වැඩි දියුණු කිරීම වැනි දේ.
  • සැබෑ ලෝක උදාහරණවලට RT-2 සෞඛ්‍ය සේවයේ රොබෝවරුන්ට හඬ විධාන මත පදනම්ව ඖෂධ ලබා ගැනීම වැනි රෝගී සත්කාර සඳහා සහාය වීමට හැකියාව ලබා දීම ඇතුළත් වන අතර, මෙම යෙදුම්වල කාර්යක්ෂමතාව සහ ආරක්ෂාව වැඩි දියුණු කිරීම සඳහා AY-Robots දත්ත රැස් කිරීමට පහසුකම් සපයයි.

රොබෝ තාක්ෂණය සහ AI හි යෙදුම්

RT-2 හි හැකියාවන් විවිධ කර්මාන්ත හරහා විහිදී ඇති අතර, මිනිසා-රොබෝ සහයෝගීතාවය සහ දත්ත මත පදනම් වූ රොබෝ තාක්ෂණය තුළ නවෝත්පාදනයන් සිදු කරයි.

  • නිෂ්පාදනයේදී, RT-2 ස්වයංක්‍රීය එකලස් කිරීම සහ තත්ත්ව පාලනය සඳහා උපකාරී වේ; සෞඛ්‍ය සේවයේදී, එය ශල්‍ය රොබෝවරුන්ට සහාය වේ; සහ ස්වයංක්‍රීය පද්ධතිවලදී, එය සංචලනය වැඩි දියුණු කරයි. නිදසුනක් ලෙස, AY-Robots හි, ටෙලිඔපරේටර් ගබඩා ස්වයංක්‍රීයකරණය සඳහා රොබෝවරුන් පුහුණු කිරීමට RT-2 භාවිතා කරන අතර, වේගය සහ නිරවද්‍යතාවය වැඩි දියුණු කරයි.
  • AY-Robots බාධාවකින් තොරව මිනිසා-රොබෝ සහයෝගීතාවය සඳහා RT-2 උපයෝගී කර ගන්නා අතර, ටෙලිඔපරේටර්වලට කාර්යයන් දුරස්ථව අධීක්ෂණය කිරීමට ඉඩ සලසන අතර ආකෘතිය ක්‍රියාකරු ආදානය මත පදනම්ව රොබෝවරුන් අනතුරුදායක ප්‍රදේශවල සැරිසරන ව්‍යසන ප්‍රතිචාර අවස්ථාවන්හිදී මෙන් සාමාන්‍ය තීරණ හසුරුවයි.
  • VLA ආකෘති ක්‍රියාත්මක කිරීමේදී දත්ත රහස්‍යතාවය සහ ආකෘති පක්ෂග්‍රාහීත්වය වැනි අභියෝග AY-Robots හි ආරක්ෂිත දත්ත ප්‍රොටෝකෝල හරහා විසඳා ගත හැකි අතර, දත්ත මත පදනම් වූ රොබෝ තාක්ෂණයේ සදාචාරාත්මක පුහුණුව සහ තත්‍ය කාලීන අනුවර්තනය සඳහා විසඳුම් සහතික කරයි.

අනාගත ඇඟවුම් සහ අභියෝග

RT-2 රොබෝ තාක්ෂණයේ උසස් AI සඳහා මාවත විවර කරන විට, එය සදාචාරාත්මක සංවර්ධනය සඳහා අවස්ථා සහ වගකීම් යන දෙකම ගෙන එයි.

  • විභව දියුණුවලට එදිනෙදා භාවිතය සඳහා වඩාත් ස්වයංක්‍රීය රොබෝවරු ඇතුළත් වන අතර, එය අවම දත්ත වලින් ඉගෙනීමට RT-2 හි ඇති හැකියාව මගින් මෙහෙයවනු ලබන අතර, AY-Robots හට ගෝලීය පරිශීලකයින් සඳහා පුළුල් කරන ලද ටෙලිඔපරේෂන් විශේෂාංග හරහා වැඩි දියුණු කළ හැකිය.
  • සදාචාරාත්මක කරුණු අතර සාධාරණ දත්ත රැස් කිරීම සහ පක්ෂග්‍රාහීත්වයන් මඟහරවා ගැනීම සහතික කිරීම ඇතුළත් වන අතර, AY-Robots රොබෝ යෙදුම් කෙරෙහි විශ්වාසය පවත්වා ගැනීම සඳහා නිර්නාමික දත්ත සමුදායන් සහ විනිවිද පෙනෙන AI පුහුණු ක්‍රියාවලීන් සමඟ විසඳයි.
  • AY-Robots හට VLA ආකෘති බුද්ධිමය පාලනයන් සඳහා ඒකාබද්ධ කිරීමෙන් ටෙලිඔපරේටර් අත්දැකීම් වැඩි දියුණු කිරීමට RT-2 උපයෝගී කර ගත හැකිය, එනම් හඬ සක්‍රිය කළ විධාන වැනි දේ, දුරස්ථ රොබෝ පුහුණුව වඩාත් ප්‍රවේශ විය හැකි සහ කාර්යක්ෂම කරයි.

නිගමනය: ඉදිරියට යා යුතු මාවත

සාරාංශයක් ලෙස, Google DeepMind විසින් RT-2 දර්ශනය, භාෂාව සහ ක්‍රියාව ඒකාබද්ධ කිරීමෙන් රොබෝ ඉගෙනීම විප්ලවීයකරණය කරමින්, AI රොබෝ තාක්ෂණයේ නවෝත්පාදනයන් පෝෂණය කරන අතර ප්‍රායෝගික යෙදුම් සඳහා නව මාවත් විවෘත කරයි.

  • මෙම ආකෘතියේ බලපෑම පවතින්නේ AY-Robots වැනි වේදිකා හරහා ඵලදායී පුහුණු දත්ත රැස් කිරීම සඳහා පෙන්නුම් කරන පරිදි, අනුවර්තනය වීමේ හැකියාව, කාර්යක්ෂමතාව සහ සහයෝගීතාවය වැඩි දියුණු කිරීමට ඇති හැකියාවයි.
  • අපි පාඨකයන්ට AY-Robots ගවේෂණය කිරීමට දිරිමත් කරමු, එහිදී ඔබට සැබෑ ලෝක අවස්ථාවන්හිදී RT-2 වැනි හැකියාවන් අත්විඳිය හැකිය.
  • VLA ආකෘති පරිණාමය වන විට, රොබෝ තාක්ෂණයේ අනාගතය මානව ක්‍රියාකාරකම් සමඟ වැඩි ඒකාබද්ධතාවයක් පොරොන්දු වන අතර, AY-Robots වැනි වේදිකාවල අඛණ්ඩ සදාචාරාත්මක දියුණුවක් සහ ගවේෂණයක් ඉල්ලා සිටී.

රොබෝ දත්ත අවශ්‍යද?

AY-Robots බාධාවකින් තොරව දත්ත රැස් කිරීම සහ පුහුණු කිරීම සඳහා ලොව පුරා සිටින ටෙලිඔපරේටර් වෙත රොබෝවරුන් සම්බන්ධ කරයි.

ආරම්භ කරන්න

Videos

Ready for high-quality robotics data?

AY-Robots connects your robots to skilled operators worldwide.

Get Started