Robotlara yeni davranışlar öğretmede çığır açan yaklaşım. Toyota Araştırma Enstitüsü (TRI) robotlara yeni davranışlar öğretmede çığır açtı. TRI, robotlara yeni ve becerikli yetenekler öğretmek amacıyla Diffusion Policy temelli bir Generative AI (Üretici Yapay Zekâ) yaklaşımı geliştirdiğini duyurdu. Bu yeni yaklaşım, “Büyük Davranış Modeli” oluşturma yolunda önemli bir adım olarak görülüyor ve robotların kullanımını önemli ölçüde iyileştiriyor1.
TRI’nin bu ilerlemesi, robotlara yalnızca birkaç saat içinde yeni ve becerikli yetenekler kazandırmak adına üretici AI teknolojisini kullandığı bir “robotlar için anaokulu” ortamını da içeriyor. Bu özel ortamda, robotlar kahvaltı hazırlama gibi belirli görevleri yerine getirecek şekilde eğitildi2.
TRI, yeni yaklaşımı kullanarak robotlara sıvı dökme, alet kullanma ve deforme olabilen nesneleri manipüle etme gibi 60’tan fazla zor ve hünerli beceriyi öğretti. Bu başarılar tek bir satır yeni kod yazılmadan gerçekleştirildi; tek değişiklik robota yeni veriler sağlamaktı. TRI, bu başarıdan yola çıkarak yıl sonuna kadar yüzlerce, 2024 yılı sonuna kadar ise 1.000 yeni becerinin öğretilmesi gibi iddialı bir hedef belirlemiştir.
Daha önce, 2021 yılında, TRI, ev ortamlarındaki karmaşık görevleri çözmek amacıyla yeni robotik yetenekler tanıttı. TRI’nin robotik uzmanları, çoğu diğer robotları şaşırtan karmaşık durumları anlamalarını ve bu tür durumlarla başa çıkmalarını sağlayacak şekilde robotları eğitmeyi başardılar. Bu eğitim aşamasında, robotlar şeffaf ve yansıtıcı yüzeylere olan tepkilerini çeşitli durumlarda anlayıp yanıt verecek şekilde eğitildi3.
TRI, yardımcı ev robotlarını mümkün kılmak için gerekli teknolojik ilerlemeleri yaratma ve kanıtlama konusunda odaklanmış durumda. TRI CEO’su Gill Pratt, 2015 yılında, robotiğin Kambriyen patlamasının anahtarının, bulut robotiği ve derin öğrenme kombinasyonunda yattığını belirtti. Bu, filo öğrenmesi olarak adlandırıldı: eğer robotlar birbirlerinden öğrenebilirse, bu, onların daha hızlı ve daha etkili bir şekilde yeni yetenekler kazanmalarını sağlar4.
Ayrıca, robotlara gösterim yoluyla öğretme avantajları da vurgulanmıştır. Gösterim yoluyla öğretme, kullanıcılar için robot davranışını tanımlamaktan ziyade göstermenin daha sezgisel olabileceği anlamına gelir. Ancak, bir insan görevi bir arayüz aracılığıyla gösterdiğinde, eğitim verileri arayüze özgü davranış kazanabilir, bu da görevin istenen şekilde gerçekleştirilmesini engelleyebilir5.
- Bu yaklaşım, robotların daha önce mümkün olmayan yollarla faydalı işler yapabilmesi için “büyük davranış modelleri” oluşturmayı vaat ediyor.
- Öğretmen, tele operasyon yoluyla bir dizi beceri gösterir. Ardından, AI tabanlı “Diffusion Policy” birkaç saat içinde öğrenir. Bu sayede, bir robotu öğleden sonra eğitebilir, gece boyunca öğrenmesini sağlayabilir ve ertesi sabah yeni bir davranışla çalışır halde bulabilirsiniz.
- Robotların dokunma duyusu olması, öğrenme sürecini daha etkili hale getiriyor. Örneğin, bir robot bir pankeki çevirebilir çünkü yüzeyle etkileşimini “hissetmek” mümkündür.
- TRI, yıl sonuna kadar yüzlerce yeni davranış öğretmeyi ve 2024 sonuna kadar binlerce yeni davranış öğretmeyi planlıyor. Ayrıca, bir robot öğrendiğinde tüm robotların öğrenmesini sağlayacak temel araçlar geliştiriliyor.
- TRI, simülasyon uzmanlığını gerçek dünya öğretimini artırmak için kullanıyor.
- Yeni yaklaşım sayesinde, robotlar artık araç kullanabilir, sıvı dökebilir ve sebzeleri soyabilir. Bu, sadece “al ve yerleştir” tarzı görevlerle sınırlı olmaktan çok daha öteye geçiyor.
Bu gelişmeler, robotların, insanların yaşam kalitesini artırmak ve yaşlanan bir toplumda onlara yardımcı olmak amacıyla nasıl eğitilebileceği ve geliştirilebileceği konusunda önemli bilgiler sunuyor.
Kaynak: