Avsnitt

  • Bu haftaki podcast'imizde, yapay zeka ve robot teknolojilerinin hızla gelişmesiyle ortaya çıkan çeşitli yenilikçi uygulamalar ve beraberinde getirdiği tartışmalı konular üzerinde durduk. Google Gemini'ın stok fotoğrafları üzerindeki filigranları silerek telif hakkı tartışmalarına yol açmasından, Nvidia'nın yeni teknoloji etkinliğine ve farklı alanlardaki yeniliklere kadar geniş bir yelpazede konuları ele aldık.

    Öncelikle, Gemini'ın stok fotoğraflarındaki watermark'ları kaldırma özelliği, telif hakkı ihlallerine yol açarak sektörde büyük bir yankı uyandırdı. Pek çok insan bu gelişmeden dolayı mutsuz, özellikle sanat eserlerini ve kreatif çalışmalarını koruma altına almayı hedefleyenler için. Bu gibi durumlar, yapay zekanın sanat ve yaratıcılığa olan etkisini gündeme taşıyor ve etik soruları da beraberinde getiriyor. Ancak, teknolojinin gelişmesiyle sanatçılar ve yaratıcılık arasındaki hassas denge yeniden gözden geçirilecek gibi görünüyor.

    Bir başka yenilik ise, Sync adındaki dudak senkronizasyonu modeli. Sinema ve televizyon endüstrisine büyük yenilikler vaat eden bu teknoloji, sesin ve görüntünün farklı dillerde senkronize edilmesini sağlıyor. Böylece, örneğin Terminatör filmindeki Arnold Schwarzenegger’ı Türkçe seslendirilmiş halde kendi sesiyle izleyebilmek mümkün olabilir. Bu tür uygulamalar dil bariyerlerini aşmada ve izleyici deneyimini daha da kişiselleştirmede önemli bir rol oynayacak gibi duruyor.

    Nvidia'nın GTC etkinliğinde de yapay zeka ve robot teknolojileri ön plandaydı. Nvidia'nın yeni çiplerinden otonom sürüş sistemlerine kadar birçok yenilik tanıtıldı. Ayrıca, robotların işgücüne katılımı konusu da Elon Musk'ın vurguladığı "sürdürülebilir bolluk" temasıyla birleşerek, insanların gelecekte daha çok yönetici konumuna yükseleceğini öngörüyor. Bu, teknolojinin iş gücü üzerindeki etkilerini anlamamıza ve gelecekte nelerle karşılaşabileceğimizi düşünmemize olanak tanıyor.

    Son olarak, çeşitli ses ve görsel düzenleme teknolojilerinden bahsettik. Grok'ın görüntü düzenleme modu ve OpenAI’ın ses modelleri, yapay zekanın medya üretim ve düzenleme süreçlerinde nasıl devrim yapabileceğini gösteriyor. Bu gelişmeler, izleyicilere daha zengin ve etkili bir deneyim sunmayı amaçlıyor. Yapay zekanın bu dinamik dünyasında, bu tür teknolojik yeniliklerin gelecekte nasıl şekilleneceğini görmek oldukça heyecan verici.

  • Bu haftaki podcast’te, Pika’nın Pikaswap özelliğiyle videoların içeriğini anında değiştirme imkanını keşfettik. Artık bir prompt girerek gözlük, saç rengi, kıyafet veya arka plandaki detayları kolayca düzenleyebiliyor; hatta ucuz bir çantanın logosunu lüks markalara dönüştürebiliyorsunuz. Bu teknolojinin özellikle video içerik üretiminde nasıl çığır açtığına dair örnekler üzerinden konuştuk.

    Daha sonra, Anthropic’in kurucusu Dario Amodei’nin, önümüzdeki bir yıl içerisinde kodlamaların tamamen yapay zeka tarafından gerçekleştirileceği vizyonunu masaya yatırdık. Kendi deneyimlerimizi paylaşarak, kısa bir prompt ile bir ajanın tüm görevleri yerine getirmesi fikrinin, yazılımın yanı sıra muhasebeci ve beyaz yakalı mesleklerde de devrim yaratabileceğini vurguladık. Ayrıca, Captions.ai’nin Mirage modeliyle gerçekçi lip ve body-sync teknolojisini, Google’ın Gemini ailesindeki Gemma 3, Gemini Robotics ve Gemini 2.0 Flash gibi yenilikleri örneklerle inceledik.

    Konuşmamızın ilerleyen bölümlerinde ise tasarım ve oyun alanında çığır açan gelişmelere değindik. Figma tasarımlarının Bolt ile çalışan uygulamalara dönüşebilmesi, Microsoft’un oyun asistanı Copilot’un strateji önerileri ve OpenAI’ın Deepseek’e yönelik güvenlik endişeleri üzerine hazırladığı tasarım, sektörün ne kadar hızlı evrildiğini gösteriyor. Ayrıca, Sesame Labs’in açık kaynak ses modeli, Handspew ile Gemini destekli nesne tanıma ve Figure’nin robot üreten fabrikası BotQ gibi yenilikler, yapay zekanın hayatımızın pek çok alanında nasıl devrim yarattığını gözler önüne serdi.

  • Saknas det avsnitt?

    Klicka här för att uppdatera flödet manuellt.

  • Bu hafta podcast’te, yapay zeka dünyasında öne çıkan en yeni gelişmeleri ele aldık. Opera’nın “Browser Operator” adlı ajanı, bir prompt girişiyle tarayıcıda otomatik işlemler gerçekleştirerek dijital etkileşime yenilik getirmeyi amaçlıyor; ancak bu tür teknolojilerde yanlış işlem riskleri de mevcut. Ayrıca, Deutsche Telekom’un 2026’da piyasaya sürmeyi planladığı AI telefon ile Perplexity gibi yerel özelliklerin deneyimleneceği, kullanıcıların Siri benzeri akıllı etkileşimler yaşayacağı bir cihazın kapıda olduğu haberleri tartıştık. Buna ek olarak, Anthropic’in 3,5 milyar dolar yatırım alması ve Claude 4’ün kısa sürede çıkabileceğine dair ipuçları, Amazon’un da bu alana yatırım yapma ihtimaline dikkat çekti.

    Yapay zeka uygulamalarının sınırlarını zorlayan yenilikler ise Meta AI’nin “Brain-to-Text” modeliyle gündeme geliyor. EEG cihazları aracılığıyla beyin dalgalarını yazıya dönüştüren bu model, invazif olmayan bir yöntem sunarken, Diff Rhythm adlı açık kaynaklı şarkı üretme modeli saniye saniye yeni şarkı sözleri oluşturabiliyor. Çinli Manus AI’nin geliştirdiği genel AI ajanı, bulut tabanlı hesaplamalarla kapsamlı analizler yaparak profesyonel dashboardlar sunarken, Google da Gemini 2.0 temelli AI modu, Gemini Live Video ve “Whisk Animate” özellikleriyle arama deneyimini ve görsel içerik üretimini zenginleştiriyor.

    Podcast’te ayrıca sosyal medya ve sektör söylentilerine de değindik. X platformunda artık grok mention’ları ile gönderiler altında etkileşim sağlanması, kullanıcıların sorularına doğrudan yanıt almasını mümkün kılacak. Microsoft’un Copilot içinde OpenAI dışında farklı modelleri test etmeye başlaması ve Apple’ın Siri konusunda büyük bir gelişme göstermemesinin yarattığı rekabet ortamı da masaya yattı. Son olarak, Ray Kurzweil’ın 2032’de “Longevity Escape Velocity” kavramıyla her yıl yaşam süresine bir yıl eklenmesi öngörüsünü irdeleyerek, yapay zeka ve bilimdeki ilerlemenin gelecekte neler getirebileceğini tartıştık.

  • Bu hafta yapay zeka dünyasında önemli gelişmeler ve yeniliklerle dolu bir gündemimiz var. Podcast'imizde ilk olarak Claude'un yeni modelleri "Sonnet 3.7" ve "Sonnet 3.7 Thinking"i ele aldık. Claude'un modelleri, yapay zeka alanında adından sıkça söz ettiriyor ve zirveyi değiştiriyor. Ayrıca, Alibaba'nın dil modeli Qwen'e yeni düşünme özelliğinin eklendiğini ve Alibaba'nın yeni video modeli Wan 2.1'i duyurduğunu konuştuk; bu model, benchmark sonuçlarına göre OpenAI'in Sora modelinden bile üstün performans sergiliyor.
    Deepseek'in yeni modeli R2'nun çalışmalarını hızlandırdığı Çin'deki yapay zeka yarışından bahsettik. Meta'nın ChatGPT'ye rakip olacak yeni uygulaması Meta AI için ortaya atılan dedikoduları ve Adobe'nin Photoshop uygulamasına eklenen yeni yapay zeka özelliklerini inceledik. Amazon'un Alexa+ için Claude'u kullanacağı ve Suno'nun da ekleneceği bilgisini paylaştık.
    Podcast'imizin bir diğer önemli konusu, Figure'ün yeni robotları O2'nin hızlı adaptasyon süreci oldu. Elevenlabs'ın Scribe modelinin text-to-speech alanında devrim yarattığını ve 99 dili desteklediğini öğrenirken, Hume AI'nın Octave modelinin ise kelimelerin anlamını anlayarak konuştuğuna değindik. Konuşmalarımızda, yeni çıkan Sesame isimli conversational voice AI ve Perplexity'ye eklenen ses modunu da ele aldık.
    Son olarak, teknolojinin ses ve dil yeteneklerinde kaydettiği ilerlemeler, Microsoft'un Small Language Model serisinin Phi 4 versiyonu ve IBM'in Granite Vision modelinden bahsedildi. Quora'nın chatbot platformu Poe'daki yenilikler ve ChatGPT 4.5'in hayal kırıklığı yanı sıra Mercury Coder isimli hızlı ve yenilikçi bir LLM modelini de keşfetmiş olduk.

  • Bu bölümde yapay zeka dünyasında yaşanan büyük değişimleri ve dikkat çeken yenilikleri konuşuyoruz. Deepseek’in chat geçmişini paylaşması ve güvenlik açıklarıyla gündeme gelmesi, OpenAI’ın suçlamaları ve erişim sorunlarıyla birleşince kullanıcılar ChatGPT’ye geri döndü. NVIDIA’nın robot eğitiminde devrim yaratan simülasyon teknolojisi ve Qwen’in OpenAI’a rakip olan yeni modelleriyle ilgili detayları paylaşıyoruz. Ayrıca, Deepseek’in değerlemesiyle ilgili ortaya çıkan şaşırtıcı gerçekler de bu bölümde ele alınıyor.

    Meta’nın VideoJam modeli, ByteDance’in Omnihuman video modeli ve Çin’den çıkan Yue isimli müzik üretme modeli gibi yaratıcı yapay zeka teknolojilerini keşfediyoruz. Perplexity’nin Sonar özelliğiyle interneti tarayarak araştırma yapma kabiliyeti, Microsoft’un OmniParser ve Muse AI modelleriyle bilgisayar kullanımı ve oyun üretiminde sunduğu yenilikler, Replit’in mobil uygulama desteği ve Zonos’un ses klonlama yetenekleri, bu bölümde detaylarıyla ele aldığımız konular arasında.

    Bunların yanı sıra, Elon Musk’ın OpenAI’ı satın alma girişimi ve Grok 3 ile ilgili büyük planlarını tartışıyoruz. SpaceX’in Mars’a göndermeyi planladığı Grok destekli robotlardan, Ilya Sutskever ve Mira Murati’nin yeni yapay zeka girişimlerine kadar sektördeki rekabetin nasıl şekillendiğini analiz ediyoruz. Meta’nın veri eğitimiyle ilgili etik tartışmalar ve yapay zekanın geleceğine dair öngörülerimizle dolu bu bölümü kaçırmayın!

  • Bu bölümde, yapay zeka dünyasındaki en son gelişmeleri konuşuyoruz! DeepSeek, yeni reasoning modeli R1'i açık kaynak olarak yayınladı. Donald Trump; SoftBank, OpenAI, Oracle ve MGX ortaklığıyla yürütülen devasa Stargate projesini duyurdu. 500 milyar dolarlık yatırım, 100.000 yeni iş imkanı. OpenAI cephesinde ise Operator isimli yeni bir ajan ve hücre dönüşümünde devrim yaratabilecek GPT-4B Micro modeli tanıtıldı. Mark Zuckerberg, Meta'nın AI veri merkezine 65 milyar dolar ayırdığını açıklarken, Elon Musk ise Grok 3'ün yakında geleceğini müjdeledi. Ayrıca bu hafta ChatGPT ve Cursor'daki kesintiler hayatları nasıl etkiledi? Tüm detaylar bu bölümde.