Google'ın sağ gözünüzün üzerinde bir ekran, sol tarafta ses kontrolü barındıran akıllı gözlük prototipi bu ay test edildi. Deneyim, cihazın İspanyolca konuşmayı gerçek zamanlı algılayıp İngilizce çevirebildiğini, ancak parlak ortamda ekran odaklamasında zorluk yaşadığını ve bir Monet tablosunu tanımak için birkaç deneme gerektirdiğini gösterdi. Daha kritik bir bulgu ise şu: Gemini'ye yüklenen fotoğrafı anime karakterine çevirmek için 45 saniye bekleme süresi gerekti. Prototip testleri, Google'ın ilk piyasaya süreceği gözlüklerin neden ses tabanlı versiyonlar olduğunu açıklıyor. 2026 sonbaharında piyasaya çıkan Android XR gözlükler, Gentle Monster ve Warby Parker çerçevelerinde, ekransız ve kamera-ses kontrol odaklı olacak. Ekran içeren versiyonlar ise daha sonra gelecek.
Prototip testleri, ekran teknolojisinin maliyetinin sadece fiyat değil, aynı zamanda görüş netliğinde zorluk, sunucu gecikmesi ve parlak ortamda kullanılabilirlik sorunlarını içerdiğini gösteriyor.
Google'ın gözlük stratejisi: Ses odaklı başlangıç, ekranlar daha sonra
Google, Android XR platformunu Samsung ve Qualcomm ile birlikte geliştirdi. Platform hem tek hem çift ekranlı gözlükleri destekliyor, ancak yol haritası açık: 2026 sonbaharında çıkan ilk ürün grubu ses ve kamera tabanlı, ekransız akıllı gözlükler olacak. Gentle Monster ve Warby Parker gibi moda ve gözlük markaları bu cihazları üretecek. Google, kullanıcı deneyimini bu şekilde kurup, daha sonra ekranlı versiyonları genişletilmiş bir güvenilir test kullanıcıları programı ile piyasaya sürmeyi hedefliyor.
Prototipin kendisi sağ gözün üzerinde tek bir ekrana sahipti ve gerçek dünyayı görürken üzerine hava durumu, yön tarifi, çeviri ve kullanıcı tanımlı AI widget'larını bindiriyordu. Ancak bu prototip nihai versiyonda olacak sensörleri barındırmıyordu; örneğin gözlüğün kafadan çıkarıldığını algılayan özellik test cihazında yoktu. Bu eksiklikler, testin bir prova değil, işleyen özellik grubunun incelenmesi olduğunu gösteriyor.
Önemli ayrıntı: Gözlükler hem Android hem iOS telefonlarla çalışacak. Gemini AI aktivasyonu iki yolla yapılıyor: "Hey Google" ses komutu veya çerçeveye dokunma. Bu kontrol mekanizması, kullanıcının telefonunu çıkarmadan soru sorabilmesi, navigasyon alabilmesi veya fotoğraf çekmesi anlamına geliyor.
Prototip testleri: Hangisi çalıştı, hangisi düştü
Test deneyimi, akıllı gözlüklerin hangi görevlerde pratik değer sunduğunu ve hangi noktalarda teknik sınıra çarptığını gösterdi.
Çalışan özellikler:
- Gerçek zamanlı çeviri: Prototip İspanyolca konuşmayı algılayıp İngilizce metin ve sesi gözlükte gösterdi. Bu özellik yolcular için anlamlı olabilir; karşınızdaki kişinin konuşmasını anlamak için telefona bakmadan yapabiliyorsunuz. - Navigasyon entegrasyonu: Google Maps ile çalışan yön tarifi, öne baktığınızda yönleri gösterip, aşağı baktığınızda harita görünümüne geçiyordu. - Kamera ve mesajlaşma: Gözlüğün kamerası ile fotoğraf çekip sesle mesajlaşma yapabilme ve YouTube Music, Google Keep, Google Maps ve Pixel cihazlarıyla entegrasyon sağlanabiliyordu.
Sorunlu noktalar:
- Nesne tanıma güvenilirliği: Prototip, bir Monet tablosunu tanımak için birkaç deneme gerektirdi. Bu, AI sisteminin görsel tanımlamada ne kadar tutarlı olduğu konusunda soru işareti bırakıyor. - Sunucu gecikmesi: Kullanıcının fotoğraftaki kişiyi anime karakterine çevirme isteği, Gemini sunucularına yuvarlama yapıldığında 45 saniyelik gecikme ile tamamlandı. Test ortamında ölçülen bu gecikme, sunucu tabanlı AI işlemlerinin taşıdığı latans riskini gösteriyor. - Ekran odaklanması: Parlak açık havada, ekranı görmek zordu. Kullanıcı, ekrana mı bakacak yoksa çevresine mi bakacak sorusunun yanıtlanması gerekiyor. Gözün odak noktası hem gerçek dünyaya hem de lens üzerindeki bilgiye gidebildiği zaman dikkat bölünüyor. - Ses kalitesi belirsiz: Gürültülü test ortamı yüzünden ses kalitesi değerlendirilemedi, ancak ilk izlenim gözlüklerin yüksek kaliteli kulaklık yerini alamayacağı yönündeydi.
Ses temelli ve ekranlı gözlükler: Hangisi ne zaman pratik
Proototip testlerinden çıkan temel soru şu: Gözlüğünüzde ekran olmalı mı, olmamalı mı?
Ses ve kamera odaklı (ekransız) deneyim şunları yapıyor:
- Fotoğraf çekip sesli AI sorgusu yapabiliyorsunuz - Müzik çalabiliyorsunuz (Spotify entegrasyonu test sırasında eksikti, çıkışta olacağı söylendi) - Gemini ile sesle arka plan görevleri (metin özeti, hatırlatma) yürütebiliyorsunuz - Navigasyon sırasında yönlendirici ses verebiliyorsunuz
Bu deneyim, Ray-Ban Meta gözlüklerine benziyor; ancak Google'ın farkı Gemini entegrasyonu ve Android XR platformunun API desteği. Ekransız gözlükler, kullanıcıya görsel bilgi yerine sesli bilgi ve kamera kaydı sunuyor. Bir test yazarı ekransız deneyimi tercih ettiğini açıkça ifade etti: Kamera ve hoparlör ile Gemini'ye erişim, birincil ekran yerine ona yeterli geliyor.
Ekranlı gözlükler ise:
- Harita, hava durumu, çeviri metnini gözünüzde gösterebiliyor - Nesne tanıma sonuçlarını anlık sunabiliyor (çalışırsa) - Navigasyonda hem yön oku hem harita görünümü veriyor
Ancak ekranlı versiyonun maliyeti var: Odaklanma zorluğu, parlak ortamlarda ekranı görememe, dikkat bölünmesi ve sunucu gecikmesi.
Gemini entegrasyonu ve kontrol mekanizması
Google, bu gözlüklerde Gemini AI'yi merkezi hale getirdi. Kullanıcı "Hey Google" dediğinde veya çerçeveye dokunduğunda Gemini aktif oluyor ve şunları yapabiliyor:
- Gerçek zamanlı çeviri (konuşmacının tonunu eşleştirme özelliğiyle) - Metin özeti ve hatırlatma gibi arka plan görevleri - Yön tarifi (kullanıcının yönüne duyarlı navigasyon) - Fotoğraf düzenleme ve nesne tanıma (sunucu üzerinde)
Bu entegrasyon, gözlüklerin "kamera ve hoparlör" olmaktan çıkıp yapay zeka asistanına fiziksel erişim aracı olmasını sağlıyor. Ekranlı versiyonlar geldiğinde de Gemini'nin widget'ları görsel olarak ekranda sunulacak.
Ancak bir risk var: Sunucu bağımlılığı. Gemini, fotoğrafı işlemek veya karmaşık sorguları yanıtlamak için Google sunucularına gidip gelmek zorunda. Test ortamında ölçülen 45 saniyelik gecikme, üretim ortamında farklı davranabilir. Eğer sık kullanılan özellikler sunucu geçişi gerektiriyorsa, kullanıcı deneyimi kesintiye uğrayabilir.
Neden ses temelli gözlükler ekranlı versiyonlardan önce çıkıyor
Parlaklık sorunları, ekran odaklanması zorlukları ve sunucu gecikmesi, Google'ın ses temelli deneyimi önce sunmasını açıklıyor. Ekran yoksa odaklanma sorunu yok, parlak ortam sorunu yok. Kullanıcı, gözüyle gerçek dünyayı görmeye devam ederken kulaklarıyla bilgiyi alıyor. Bu, daha güvenilir bir başlangıç noktası. Ekranlı versiyonlar, bu sorunlar çözüldüğünde veya teknik ilerledikçe yaygınlaşacak.