Anthropic'in yeni yapay zekası bilgisayarı kendi başına kullanıyor: fareyi hareket ettiriyor ve belgeleri dolduruyor

Suzan

New member
Dünyanın en tanınmış ve en etkili yapay zeka geliştiricilerinden biri olan Anthropic, amiral gemisi modelinin güncellenmiş versiyonunu sundu. Claude 3.5 SonelerŞirketin açıklamasına göre bu sürüm, önceki versiyona kıyasla önemli gelişmeler sunuyor ve ilerleme “dikkate değer” olarak değerlendiriliyor programlama alanında.

Claude 3.5 Sonnet'in halihazırda tüm kullanıcılar için mevcut olan (ücretsiz ve ücretli) güncellenmiş sürümü performansını artırdı SWE tezgahı Doğrulandı %33,4'ten %49,0'a, “gibi muhakeme modelleri de dahil olmak üzere kamuya açık tüm modellerden daha iyi performans sergiliyor” OpenAI o1 önizlemesi ve otomatik programlama için tasarlanmış sistemler”.

“SWE-bench Verified”, yazılım mühendisliği görevlerinde performansı ölçmek ve karşılaştırmak için tasarlanmış, spesifik ve titizlikle değerlendirilen bir kıyaslamadır – esasen standartlaştırılmış bir testtir.

Ancak Claude 3.5 Sonnet'in yeni sürümü yalnızca – tarafından yayınlanan kriterlere göre değil Antropik – öncekinden daha yetenekli ve zeki.

Yükseltilmiş bir Claude 3.5 Sonnet ve yeni bir model olan Claude 3.5 Haiku ile tanışın. Ayrıca beta sürümüne yeni bir yetenek de getiriyoruz: bilgisayar kullanımı.

Geliştiriciler artık Claude'u bilgisayarları insanların kullandığı şekilde (bir ekrana bakarak, imleci hareket ettirerek, tıklayarak ve metin yazarak) kullanmaya yönlendirebilir. pic.twitter.com/ZlywNPVIJP

— Antropik (@AntropikAI) 22 Ekim 2024
Tarafından kurulan şirket Dario ve Daniela AmodeiTahmini piyasa değeri 40 milyar dolar olan, halka açık beta sürümünde anında büyük ilgi uyandıran yeni bir özellik tanıttı: bilgisayarın kullanımı. API aracılığıyla hemen kullanılabilir.

“API” terimi, geliştiricilerin bu yeni yeteneği uygulamalarına ve hizmetlerine entegre etmek için kullanabileceği bir dizi aracı ifade eder.

Claude'un bireysel görevleri tamamlamasına yardımcı olacak özel araçlar oluşturmak yerine, Anthropic, AI genel bilgisayar becerilerini etkili bir şekilde “öğretiyor”insanlar için tasarlanmış çok çeşitli uygulama ve yazılımları kullanmalarına olanak tanır.

Geliştiriciler, henüz test aşamasında olan ve chatbot kullanıcılarına açık olmayan bu yeni yeteneklerden yararlanabilirler. Tekrarlanan süreçleri otomatikleştirinyazılım geliştirip test edin ve web araması gibi görevleri gerçekleştirin.

Claude bilgisayarı bir insanın kullanacağı gibi kullanmak: ekrana bakmak – yani yapay zekanın bağlamı belirlemesine ve incelemesine olanak tanıyan ekran görüntüleri almak – imleci hareket ettirmek, düğmelere tıklamak ve metin yazmak.

Hahaha, Google'a yeni Antropik Bilgisayar Kullanımı aldım, kişisel web sayfamı ziyaret edin ve orada orijinal Eliza bot (1966) ile bir süre sohbet edin.
Tam bir Bilimkurgu havası! pic.twitter.com/IlyFA7zurp

— Denis Shiryaev (@literallydenis) 22 Ekim 2024
Anthropic, “Claude 3.5 Sonnet, halka açık beta bilgi işlem sunan ilk ileri teknolojiye sahip yapay zeka modelidir” dedi. Bu aşamada hala deneysel, yapay zeka hala hantal ve zaman zaman hataya açık. Geliştiricilerden geri bildirim almak için bu özelliği erkenden yayınlıyoruz ve bu özelliğin zaman içinde hızla gelişmesini bekliyoruz. İnsanların zahmetsizce gerçekleştirdiği kaydırma, sürükleme, yakınlaştırma gibi bazı eylemler şu anda Claude için zorluklar yaratıyor.”

Bir video gösteriminde, Sam Ringer, Anthropic'te araştırmacıClaude'un harici bir web sitesindeki formu bir e-tabloda gezinerek, CRM'yi analiz ettikten sonra bir şirketin bilgilerine bakarak ve ardından bir formun alanlarını anlayıp doldurarak nasıl doldurabildiğini gösterdi.


Antropik bir sözcü, “İnsanlar, 'bu formu doldurmak için bilgisayarımdaki ve çevrimiçi verileri kullanma' gibi Claude'un eylemlerini yönlendiren özel talimatlar sağlayarak yapay zekanın kontrolünü elinde tutuyor” dedi.

“İnsanlar erişimi gerektiği gibi etkinleştiriyor ve kısıtlıyor. Claude, belirli bir görevi gerçekleştirmek için kullanıcının talimatlarını bilgisayar komutlarına (örneğin imleci hareket ettirme, tıklama, yazma) böler.”

Claude'un yetenekleri gerçekte tamamen yeni değiller.

başlangıç Tavşanörneğin, çevrimiçi sinema bileti satın almak gibi şeyler yapabilen bir web aracısı üzerinde çalışıyor. ustaYakın zamanda Amazon tarafından satın alınan yapay zeka modellerini, web sitelerinde özerk bir şekilde gezinmek ve yazılım kullanmak için eğitiyor.