Google Antigravity Kullanım Kılavuzu 2026

Antigravity'nin Ajan Odaklı Paradigmasını Anlamak

Google Antigravity'yi geleneksel IDE kavramından çok daha ötede bir deneyim olarak görüyorum. Burası otonom ajanların planlama ve kodlama gibi ağır işleri üstlendiği bir görev kontrol merkezi. Bu platformu kullanırken artık sadece kod yazmıyorum. Editörde rahatça gezinebilen, terminale komut gönderebilen ve yaptıklarını doğrulamak için web'de arama yapabilen dijital bir ekibi yönetiyorum. Bu sistemin merkezinde Uygulama Planı ve Görev Listesi yer alıyor. Bunlar sadece metin dosyaları değil. Sürekli kod detaylarında kaybolmadan projenin kontrolünü elinizde tutmanızı sağlayan stratejik denetim noktaları. Manuel kodlamadan ajanları yönetmeye geçiş, köklü bir zihniyet değişimi gerektiriyor. Tek tek tuğla dizen bir usta olmaktan çıkıp, genel planlara onay veren bir mimara dönüşüyorsunuz. Platform, geliştirme döngüsünü toparlamak için özel bir Ajan Yöneticisi arayüzü kullanıyor. Bu sayede bir özelliğin başlangıçtan bitişe tüm aşamalarını tek bir ekranda görebiliyorsunuz. Editör ile Ajan Yöneticisi arasında geçiş yapmak Cmd+E kısayoluna basmak kadar anlık. Ajan arayüzü içindeyken terminali açmak ise sadece Cmd/Ctrl+J gerektiriyor. Ajan sizin yerinize tüm bu araçlar arasındaki bağlamı hafızasında tuttuğu için, pencereler arası geçişlerin yarattığı o zihinsel yorgunluk tamamen ortadan kalkıyor. Tam olarak kavramamın biraz zaman aldığı asıl detay şuydu: Antigravity sıradan bir otomatik tamamlama asistanı değil. Projenizi okuyor. Mimarinizi anlıyor. Size bir plan sunuyor. Onaylarsanız bu planı dosyalarınızda, terminalde ve hatta bir tarayıcıda bizzat uyguluyor. Size düşen tek rol denetlemek. Siz Uygulama Planı'nı inceliyor ve onaylıyorsunuz, yönlendirdiğiniz ajan da gerisini hallediyor. Antigravity'yi bugüne kadar denediğim diğer tüm yapay zeka asistanlarından ayıran şey tam olarak bu kusursuz geri bildirim döngüsü.

Hızlı Referans

Ajan Yöneticisi ekranı ile kod editörü birbirinden tamamen kopuk gibi

Ajanı ne zaman serbest bırakıp ne zaman müdahale edeceğinizi kestiremiyorsunuz

Farklı oturumlar arasında oturumun bağlamı kayboluyor gibi geliyor

Editör ve Ajan arayüzü arasında anında geçiş yapmak için Cmd+E kısayolunu kullanın

Ajanın yazdığı kodları doğrudan yürütmesine izin vermeden önce Uygulama Planı'nı mutlaka inceleyin

Ajanın bağlamı temiz tutabilmesi için her yeni özelliğe sıfırdan yeni bir oturumla başlayın

Çoklu Ajan İş Akışlarına Alışmak

Günlük proje geliştirme döngümde yaşadığım en köklü değişimlerden biri çoklu ajan iş akışlarına geçmek oldu. Antigravity aynı anda birden fazla görevi yürütmeyi destekliyor. Ana editörünüzü kilitlemeden paralel işlemler yürütebiliyorsunuz. Bir ajana uzun soluklu ve kapsamlı bir görev verdiğimde çıktıyı bekleyerek vakit kaybetmiyorum. Hemen başka bir ajan başlatıyor veya kodun farklı bir bölümüne odaklanıyorum. Bu yetenek özellikle üçüncü taraf modelleri entegre ederken parlıyor. Antigravity bir VSCode temeli üzerinde koştuğu için resmi Codex eklentisini doğrudan kullanıyorum. Bu sayede GPT-5.4 gibi amiral gemisi modellerini Gemini ile aynı ortama çekiyorum. OpenAI'ın amiral gemisi modelleri ağır kod yazımında inanılmaz yetenekli. Ancak çıktı üretme hızında bazen Gemini'ın gerisinde kalabiliyorlar. Codex karmaşık bir özelliği kodlarken, ben aynı anda yerel Gemini ajanını kullanarak dokümantasyon yazıyor veya farklı bir servisi yeniden yapılandırıyorum. Aslında iki büyük rakibi tek bir çalışma alanında birleştiriyorum. Sıklıkla başvurduğum pratik bir iş akışı var. Aynı projede ajanlara farklı roller atamak. Gemini'ın hızından ve kod tabanını derinlemesine tarama yeteneğinden yararlanarak ilk mimari planlamayı ve kod incelemesini ona bırakıyorum. Plan onaylandıktan sonra asıl kodlama aşamasını Codex ajanına devrediyorum. Bu ikili otonom strateji hem hızlı planlama hem de titiz bir yürütme sunarak genel üretim hızımı ciddi şekilde artırıyor.

Hızlı Referans

Uzun süren ajan görevlerini beklemek geliştirme hızını kesiyor

Daha yavaş çalışan modeller ana geliştirme akışını kilitliyor

Planlama ve kodlama aşamaları için farklı türde akıl yürütme becerilerine ihtiyaç duyuyorsunuz

İlk ajan arka planda çalışırken yeni bir editör sekmesi açın ve ikinci bir ajanı otonom başlatın

Ağır kodlama görevlerini Gemini ile senkronize yürütmek için resmi Codex eklentisini kullanın

Hızlı mimari analizleri Gemini'a devredin ve derinlemesine kod uygulamasını Codex modeline atayın

Optimize Edilmiş İş Akışları İçin Stratejik Model Seçimi

Antigravity'nin verimliliği tamamen o anki göreviniz için seçtiğiniz modele bağlı. Nisan 2026 itibarıyla platform, Google Vertex Model Garden aracılığıyla özenle seçilmiş bir zeka havuzu sunuyor. Bu kendi API anahtarınızı getirdiğiniz bağımsız bir yapılandırma değil. Antigravity ortamdaki entegre modellere güvenerek çalışıyor. Karmaşık refactor işlemleri veya köklü mimari kararlar için derin bir mantık yürütmeye ihtiyaç duyuyorsam adresim belli Gemini 3.1 Pro. Bu model devasa bir kod tabanındaki o ince bağımlılıkları anlamak için gereken bilişsel derinliğe sahip. Diğer taraftan, hızlı döngüler ve birim testleri için Gemini 3.1 Flash'ı kullanıyorum. Çünkü yüksek hızı çok daha çevik bir geri bildirim döngüsü sağlıyor. Vertex üzerinden sunulan üçüncü taraf modelleri kullanmanın da ciddi bir değeri var. Claude Opus 4.6 kurumsal analiz ve sürdürülebilir mantık yürütme konusunda öne çıkıyor. GPT-OSS ise çıkarım süreci üzerinde tam kontrole ihtiyaç duyduğunuz kurulumlar için eşsiz bir açık ağırlıklı esneklik sunuyor. Antigravity ayarlar sekmesinde modeller için Yüksek ve Düşük varyantları barındırıyor. Bu varyantların kontrol ettiği kesin parametreler tek bir resmi dokümanda yayınlanmamış durumda. Bu yüzden çıktı kalitesi ile hız arasındaki doğru dengeyi bulmak adına her iki varyantı da kendi özel iş yükünüzde test etmenizi öneririm. Ayrıca Gemini API'sini doğrudan kullanırken düşünme düzeyi parametrelerini değiştirmenizi de muhakkak tavsiye ediyorum. 'thinking_level' değerini MEDIUM olarak ayarlamak kapsamlı bir düşünce zincirine ihtiyaç duymayan görevlerde çıktının kalitesini bozmadan tepki süresini muazzam düşürüyor.

Hızlı Referans

Model basit görevlerde çok fazla düşünerek yavaş yanıt veriyor

Kullanılan model hızlandıkça üretilen kod kalitesinde düşüş yaşanıyor

Belirli bir görev türü için spesifik olarak hangi modeli seçeceğinizi kestiremiyorsunuz

Rutin geliştirme işleri için Gemini Flash modeline geçin veya düşünme seviyesini MEDIUM yapın

Mimari düzeydeki kararlar ve karmaşık refactor işleri için Gemini 3.1 Pro tercih edin

Maliyet hesabının ikinci planda olduğu derin kod analizleri için Claude Opus 4.6 modelini kullanın

Performans Ayarı ve Gecikme Yönetimi

Yavaş çalışan bir editörün yaratıcı akışınızı nasıl baltalayacağını çok iyi biliyorum. Bu yüzden tüm Antigravity kurulumlarımda performans ayarına birincil önceliği veriyorum. Zaman içinde bunu her yeni projemde kullandığım beş adımlı net bir rutine dönüştürdüm. ### Adım 1 Doğru Süreç Modunu Seçmek Hızlı Mod tamamen izole ve küçük değişiklikler için yapılandırılmış planlama adımını hızlıca atlamak üzere tasarlandı. Ben bunu küçük refactor süreçleri, anlık kod düzeltmeleri ve tek dosyalık güncellemeler için kullanıyorum. Eğer ufak tefek işlerde gözle görülür bir gecikme yaşıyorsanız, arayüzü Planlama Modu'ndan Hızlı Mod'a geçirmek o gecikmeyi çoğu zaman kökünden çözüyor. ### Adım 2 Hıza Uygun Bir Model Belirlemek Gemini Flash yüksek hacimli veri işlemek için özel olarak inşa edildi. Sürecinizde hız faktörü derin akıl yürütmeden daha önemliyse aradığınız net cevap her zaman Flash'tır. Antigravity'nin kendi belgeleri de bu durumu destekliyor. ### Adım 3 Diyalog Uzunluklarını Yönetmek Bir konuşma uzadıkça ajanın arka planda işlemesi gereken veri miktarı da şişiyor. Ben her yeni özellik geliştirmesine sıfırdan ve yepyeni bir oturumla başlamayı alışkanlık edindim. Eğer mevcut oturumda çok fazla geçmiş biriktiyse ajana sadece devraldığı ilerlemeyi madde madde özetletiyorum. Ardından sadece o özet metnini yeni bir oturuma vererek bağlamı taşıyorum. ### Adım 4 MCP ve Entegrasyon Yükünü İzole Etmek Ağır çalışan MCP sunucuları aşırı yoğun komut dizileri yüzünden ortamda dengesizlik yaratabilir. Sebepsiz bir gecikme tespit ettiğimde, hemen tüm MCP sunucularını kapatıp basit bir test komutuyla ('Merhaba' gibi) sistemin tepki süresini ölçüyorum. Gecikme aniden kayboluyorsa arkaplandaki suçluyu bulmak için o sunucuları süreç içinde tek tek devreye sokuyorum. ### Adım 5 Yerel Kaynak Baskısını Hafifletmek Antigravity doğrudan kendi cihazınızda çalışan bir masaüstü yazılımı. Devasa repoları endekslemek, arka planda telemetri aktarmak ve kullanmadığınız eklentileri öylece açık tutmak işlemciyi ciddi seviyede yoruyor. Ajanın okuma yetkisini her daim belirli alt dizinlerle sınırlandırıyorum. Kullanmadığım her eklentiyi kapatıyorum. Bulut tabanlı modellerle konuşurken de sistemin kararlılığını artırmak için sadece Vertex küresel uç noktalarını tercih ediyorum.

Hızlı Referans

Antigravity yüksek donanımlı cihazınızda bile hantal çalışıyor

Kod tabanını indeksleme sırasında cihazınızın bellek ve işlemci kullanımı tavan yapıyor

Ajanla olan konuşmanız uzadıkça yanıt alma süreleriniz katlanarak düşüyor

Tüm MCP sunucularını devre dışı bırakın ve sorunlu sunucuyu tespit edene kadar onları tek tek açın

Tüm projenin boş yere indekslenmesini önlemek için ajanın okuma yetkisini belli klasörlerle sınırlayın

Diyalog şiştiğinde ajandan durumu özetlemesini isteyin ve işinize yepyeni bir oturumda devam edin

Model Bağlam Protokolü ile Ajan Yeteneklerini Genişletmek

Antigravity'nin asıl potansiyeli, onu Model Bağlam Protokolü (MCP) üzerinden harici araçlarınıza ve veritabanlarınıza bağladığınızda ortaya çıkıyor. MCP aslında ajanınızın zekasıyla kendi altyapınız arasında köprü kurmasına olanak tanıyan bir standart. Sistemimdeki bağlantıları doğrudan `~/.gemini/antigravity/mcp_config.json` konumundaki dosyam üzerinden tanımlıyorum. Arayüzden gitmek isterseniz yol şöyle; Ayarlar, ardından MCP Sunucularını Yönet, son olarak da Ham Yapılandırmayı Görüntüle. Sisteme bu uzmanlaşmış sunucuları ekleyerek, yönettiğim ajanların veritabanlarını sorgulamasını, dahili API'lere dokunmasını ve bulut kaynaklarımı doğrudan editör üzerinden yönetmesini sağlıyorum. Örnek olarak iki farklı sunucuyu (biri Google Geliştirici Bilgisi, diğeri ise n8n otomasyonu için) birbirine bağlayan sağlam bir MCP yapılandırmasını inceleyebilirsiniz: ```json { "mcpServers": { "google-developer-knowledge": { "serverUrl": "https://developerknowledge.googleapis.com/mcp" }, "n8n-mcp": { "command": "node", "args": ["path/to/n8n-mcp/dist/mcp/index.js"], "env": { "MCP_MODE": "stdio", "N8N_API_URL": "http://localhost:5678", "N8N_API_KEY": "YOUR_SECRET" } } } } ``` Bu yapılandırmadaki ortam değişkenleri ve dosya yolları konusunda çok titiz olmanızı tavsiye ederim. Yanlış yazılan tek bir harf bile, çözümü saatler süren sessiz bağlantı hatalarına neden olabiliyor. Antigravity sistemin kalbindeki mantık modelini Ollama gibi yerel alternatiflerle değiştirmenize izin vermiyor. Ancak yerel hizmetlerinizi MCP üzerinden araca ekleyerek bu engeli aşabilirsiniz. Bu hibrit teknik size bulutun üst düzey akıl yürütme becerisini ve yerel sistemin güvenliğini aynı anda sunar. Örneğin, sisteme her zaman canlı dokümantasyon çeken yerel bir MCP sunucusu bağlıyorum. Böylece ajan, hiçbir manuel müdahaleye gerek duymadan API özelliklerinin en güncel haline anında erişiyor.

Hızlı Referans

MCP sunucusu Antigravity'ye bağlandığı halde komutlarınıza hiçbir yanıt vermiyor

Ajan, dahil ettiğiniz MCP sunucusundaki araçları algılamakta zorlanıyor

Yerel bir hizmetle yaptığınız entegrasyon ekranda hata vermeden sessizce çöküyor

Sistem dosyasındaki (mcp_config.json) ortam değişkenlerinin ve dizin yollarının birebir doğru olduğunu mutlaka iki kez kontrol edin

MCP sunucusunu editöre bağlamadan hemen önce bağımsız terminal günlüklerinden sağlıklı çalıştığını teyit edin

Yerel hizmetleri bağlarken her zaman localhost URL formatını kullanın ve başlatmadan önce portların açık olduğundan emin olun

Otonom İş Akışlarında Yönetişim ve Güvenlik

Otonom ajanlara cihazımda kod yürütme izni verirken güvenlik kavramını hiçbir zaman şansa bırakmam. Antigravity yeni bir projeye başlarken daima kurduğum kritik koruma katmanları sunuyor. ### Adım 1 Terminal Güvenliğini Sağlamak Terminal ekranı için her zaman Katı Mod seçeneğini aktif etmenizi öneririm. Katı Mod devreye girdiğinde yalıtım mekanizması otomatik olarak çalışır ve ajanın tetiklediği komutların yetkileri kısıtlanır. Bu önlem hatalı yazılmış devasa bir betiğin yerel dosyalarınızı uçurmasını veya hassas verilerinizi dışarı sızdırmasını kökünden engeller. Ayrıca, ajanı terminalde veya dosya dizininde kritik bir işlem yapmadan hemen önce sistemden insan onayı isteyecek şekilde ayarlayabilirsiniz. Beklenmedik bir `rm -rf` komutunun tüm projeyi yakacağı üretim ortamlarında ben bu ayarı her zaman açık tutuyorum. ### Adım 2 Tarayıcı Sınırlarını Çizmek Sistemin entegre tarayıcı aracı, beyaz liste adını verdiğimiz bir izin şemasıyla çalışır. Liste varsayılan olarak yalnızca kendi cihazınızı (localhost) içerecek şekilde gelir. Bu listenin dışına çıkan her URL adresi sizden özel onay talep eder. Ben kendi izin listemi her zaman localhost ve şirket içi iç dokümantasyon ağlarıyla sınırlıyorum. Özellikle yerel hizmetleri MCP üzerinden sisteme kattığınızda bu kural hayati önem taşır. Çünkü ajanın görevi sırasında tamamen güvensiz dış sitelerde gezinmesini istemezsiniz. ### Adım 3 Proje Düzeyinde Kurallar Koymak Ajanın uymasını istediğim tüm kuralları `AGENTS.md` dosyasına yazıyorum. Küresel çapta bir kural belirleyeceksem de kök dizindeki `~/.gemini/GEMINI.md` dosyasını kullanıyorum. Bu kurallar "asla eval() çalıştırma", "HTTP yanıtlarına kesinlikle güvenlik başlıkları koy" veya "doğrulanmamış kaynaklardan paket indirme" gibi sert direktifler olabilir. Ajanımız her yeni açılışta bu dosyayı okur ve metni değişmez bir kanun olarak kabul eder. İşte tüm bu proaktif sınırlar sayesinde, cihazımın güvenliğinden en ufak bir taviz vermeden otomasyonun tüm hız ve rahatlığından sonuna kadar faydalanıyorum.

Hızlı Referans

Ajan size haber vermeden doğrudan sistem üzerinde yıkıcı bir terminal komutu yürütüyor

Entegre tarayıcı aracı sizin izniniz olmadan alakasız bir dış web sitesine gidiyor

Sistem klasöründeki AGENTS.md dosyasına yazdığınız katı güvenlik kuralları ajan tarafından tamamen göz ardı ediliyor

Terminalde yürütülen komutları kontrol altına almak için ayarlar sekmesinden Katı Mod seçeneğini derhal aktif hale getirin

Tarayıcının beyaz listesinde dış bağlantılar tutmayın ve listeyi yalnızca kendi cihazınızla sınırlayın

İlgili AGENTS.md dosyanızı projenizin tam kök dizininde konumlandırdığınızdan emin olun

Maliyet Optimizasyonu ve Kaynak Yönetimi

Üretken yapay zeka operasyonlarının bütçesini kontrol altında tutmanın her profesyonel geliştirici için bir öncelik olduğunun çok iyi farkındayım. Antigravity tarafında ben aktif kredi tüketimimi doğrudan sistem ayarlarındaki Modeller bölümünden takip ediyorum. Geliştirme ortamımın farkında olmadan belirlenen bütçeyi yakmasını engellemek için her zaman AI Kredi Aşımları engelleyicisini kullanıyorum. Özellikle aylar süren ve yoğun mantık yürüten yapılar inşa ederken bu ayar hayat kurtarıyor. ### Arka Planda Toplu İşlemeyi Kullanmak Zamanlama açısından aciliyeti olmayan her türlü senaryoda Vertex AI'ın toplu işleme yeteneğinden sonuna kadar faydalanırım. Resmi Gemini Geliştirici API dokümanları toplu iş okumalarının anlık tahmin modeline göre doğrudan yüzde 50 oranında bir maliyet indirimi sağladığını belirtiyor. Acil gözden geçirmeleri, rutin analizleri veya devasa test yazımlarını toplu iş kuyruğuna atarak hızımı asla kesmeden fatura maliyetimi tam yarı yarıya indiriyorum. ### Bağlamı Karşı Tarafta Önbelleğe Almak Ağ yapılandırmasında Vertex AI size hem örtük bağlam önbelleği hem de isteğe bağlı, doğrudan erişilebilir önbelleğe alma imkanı tanıyor. Bir projeyi günlerce açık tutuyorsam, devasa kod tabanını sistemin önbelleğinde saklamak ajanın tüm mimariyi her defasında sıfırdan sindirmeden doğrudan referanslara yönelmesini sağlıyor. Önbellekten dönen cevaplar sadece yanıt sürenizi kısaltmakla kalmıyor, cebinizdeki jeton maliyetini de muazzam düşürüyor. Ben bu yapıları geniş kapsamlı şablonlar tasarlarken ciddi şekilde etkili buldum. ### Kararlılık ve Hız Dengesi Kurmak Nisan 2026 itibarıyla güncel olan Gemini API; Standart, Esnek ve Öncelikli adını verdiğimiz üç farklı performans katmanı sunuyor. Sistem varsayılan olarak Standart sürümle gelir. Esnek mod, çok kısa süreli gecikmelerin tolere edilebileceği anlarda harika fiyatlamalar sağlar. Öncelikli mod ise ekstra bir maliyet karşılığında sunucudan kesin ve kesintisiz yanıt süresi garantisi verir. Ben ağır ve rutin okumalarım için Esnek modda çalışıyorum. Anında yanıt beklediğim kod tamamlama süreçlerinde ise doğrudan Öncelikli modu devreye alıyorum. ### Temiz Bir İstem Disiplini Gereksiz okuma maliyetlerinden kaçınmak için kod ajanına doğrudan ve inanılmaz net komutlar verin. İyi düşünülmüş net bir talimat her zaman birden fazla deneme gerektiren o belirsiz varsayımlardan çok daha uygun maliyetlidir. Toplu iş komutları vermek, önbelleği temiz kullanmak, modeli akıllı seçmek ve istemleri basit tutmak beni her zaman yüksek üretkenliğe itiyor. *Not Bu kılavuzdaki donanım ve API metrikleri sistemin ilk paylaşıldığı Nisan 2026 değerlerini yansıtmaktadır. Doğrudan canlı maliyetleri görmek için her işe başlamadan önce Vertex AI sayfasına bir göz atabilirsiniz.*

Hızlı Referans

Ajanı besleyen jeton kredi tüketimi, projede yaptığınız işlem yoğunluğuna kıyasla beklenmedik şekilde yüksek geliyor

Önemsiz rutin işlemleri arka planda çözmesi için toplu iş komutu sürecini nasıl etkinleştireceğinizi kestiremiyorsunuz

Kök kod tabanınızı önbelleğe aldığınız halde okuma maliyetlerinde hiçbir düşüş gözlemlemiyorsunuz

Yapılandırma ayarlarındaki Modeller bölümünü açın ve harcamanızı kontrol etmek için AI Kredi Aşımları limitini kesin bir rakama kilitleyin

Gecikmesi tolere edilebilir tüm rutin kod işleriniz için doğrudan Vertex AI Bulk API yapısına geçin

Ajanın hızlı önbellek geri dönüşü yapabilmesi için gönderdiğiniz isteklerin birbiriyle uyumlu sağlam bir mimariyi referans aldığından emin olun

Kalıcı Kurallar, İş Akışları ve Ajan Özelleştirme

Antigravity'de benim için en değerli özelliklerden biri kesinlikle dosya tabanlı yapılandırmalarla kalıcı davranışlar tanımlayabilmek. Her yeni projede veya ajanla her yeni diyalogda aynı sıkıcı talimatları tekrar tekrar yazmak yerine, tüm kişisel tercihlerimi ajanın arka planda otomatik okuduğu Markdown dosyalarına kodluyorum. ### Adım 1 Küresel Kuralları Belirlemek Sistem kökündeki `~/.gemini/GEMINI.md` dosyam tamamen küresel bir talimat seti olarak çalışır. Buraya yazdığım her kelime, Antigravity'de açacağım her yeni projede geçerlidir. Ben bunu daha çok kök prensipler için kullanıyorum; tercih ettiğim temiz kodlama stili, esnemez güvenlik talimatlarım, git commit mesajı formatlarım ve test felsefem hep bu dosyadadır. Ayrıca 1.20.3 sürümünden bu yana Antigravity'nin `AGENTS.md` dosyasından da okuma yapabildiğini belirteyim, bu da kuralları organize etmek için harika bir ikinci alan sunuyor. ### Adım 2 Çalışma Alanı Kurallarını Yönetmek Projeye has özel davranışlar gerektiğinde, projemin ana dizininde bulunan `.agents/rules/` klasörü içerisinde Markdown dosyaları açıyorum. Bu kurallar sadece ve sadece o projenin içindeyken geçerlidir. Örneğin elimdeki bir Python projesinde, ajanın her fonksiyona kesinlikle tür ipuçları (type hints) eklemesini zorunlu kılan bir kural yazarım. Başka bir React projesinde ise sınıf tabanlı bileşenler yerine fonksiyonel bileşenlerin kullanılmasını zorunlu kılan bambaşka bir talimat verebilirim. ### Adım 3 İş Akışlarını Kurmak İş akışlarımız `.agents/workflows/` dizininde tutulur. Bunlar ajanın kritik görevler için izlemasını istediğim adım adım prosedürleri tanımlar. Dağıtım kontrol listeleri (deployment checklists), kod inceleme adımları ve sürüm yayınlama planları için burayı kullanıyorum. Ajanı çağırdığınız anda bu akışlara referans vererek her adımı sırayla, eksiksiz yürütmesini sağlayabilirsiniz. ### Ajan Özelleştirme Arayüzü Hatası 2026'nın başlarında 'Ajan Özelleştirmeleri' adlı kullanıcı arayüzü panelinde algılama sorunları olduğunu belirtmem lazım. Sistem bazen kuralları veya iş akışlarını arayüzde doğru listeleyemiyor. Böyle bir şey yaşarsanız arayüzü tamamen es geçin ve `.agents/` klasör yapınızı doğrudan dosya yöneticisi üzerinden manuel yönetin. İnanın bana, dosya tabanlı yaklaşım o grafik arayüzden çok daha güvenilir.

Hızlı Referans

Ajanınız, özenle GEMINI.md veya AGENTS.md dosyasına yazdığınız kuralları tamamen görmezden geliyor

Özelleştirmeler paneline girdiğinizde sistem boş bir çalışma alanı hatası veriyor

Sisteme verdiğiniz iş akışı adımları sırayla veya eksiksiz yürütülmüyor

GEMINI.md dosyanızın herhangi bir alt klasörde değil, kesinlikle ~/.gemini/GEMINI.md konumunda durduğundan emin olun

Hatalı kullanıcı arayüzüne takılmayın ve .agents/rules/ ile .agents/workflows/ klasörlerine doğrudan sistem dizininden erişip yönetin

Markdown içindeki iş akışı adımlarınızı net sayılarla numaralandırın ve her adım için ajana kesin bitiş kriterleri sunun

Planlama Modu, Hızlı Mod ve Yapıt Yaşam Döngüsü

Antigravity üzerinde çalışırken Planlama Modu ile Hızlı Mod arasındaki o ince ayrımın en kritik ayar olduğuna inanıyorum. Bu iki modu doğru anladığınızda, sistemle olan her etkileşiminizin hızı, kalitesi ve en önemlisi öngörülebilirliği arşa çıkıyor. ### Ajanın Planlama Modu Planlama Modu her zaman o devasa, çok dosyalı ve karmaşık mühendislik süreçleri için varsayılan ayarımdır. Bu modu çalıştırdığınızda ajan koda elini bile sürmeden size son derece yapılandırılmış geliştirme yapıtları sunar: - **Uygulama Planı** Dosya dosya neyin değişeceğini gösteren şeffaf bir teklif belgesidir. Ajan tek bir satır kodu bile oynatmadan önce bu planı okur onaylarım. - **Görev Listesi** Plandan çıkarılan bir adım adım kontrol listesidir. Ajan bir yandan çalışırken, arayüzde hangi adımda olduğunu buradan işaretler. - **İzlenecek Yol** Görev bittikten sonra arkada tam olarak neyin, neden değiştiğinin teknik özetidir. İleride kod incelemesi ve projenin dokümantasyonu için hep buraya başvuruyorum. Bu üçlü yapıt mimarisine **Görev Grubu** diyoruz. Dev refactor işlemlerinde, baştan aşağı yeni bir özellik test ederken veya ikiden fazla dosyayı etkileyen herhangi bir senaryoda Planlama Modu kesinlikle vazgeçilmezimdir. ### Ajanın Hızlı Modu Hızlı Mod ise o uzun uzadıya süren planlama seremonisini tek hamlede çöpe atar. Uygulama Planı yazmakla saniye bile kaybetmez ve direkt olarak koda müdahale eder. Nokta atışı tek dosyalık düzeltmelerde, bozuk bir formatı anında düzeltmede, ajana sorduğum hızlı teknik sorularda her zaman Hızlı Modu kullanırım. Burada altın kural şu; basit ve önemsiz görevler için asla Planlama Modunu açmayın. Tek satırlık bir düzeltme için sistemin devasa yapıtlar okuyup yazması korkunç bir vakit israfıdır. Tam tersi, devasa ve karmaşık yapısal değişiklikler için de Hızlı Modu kullanmayın. Plansız hareket eden bir sistem projede birbiriyle kopuk kod parçaları ve öngörülemeyen çöküşler yaratır. ### Benim Kişisel İş Akışım Ben kritik her sisteme mutlaka Planlama Modunda giriyorum. Sistem bana Uygulama Planını sunuyor, dikkatlice okuyup mimari onayı veriyorum ve ajanın koda inmesine müsaade ediyorum. O ağır yapısal işlem tamamen bittiğinde ise küçük revizeler, ufak tasarımsal cilalar ve basit kod düzeltmeleri için direkt Hızlı Moda dönüyorum. Bu iki aşamalı hibrit yapı bana hem keskin bir kontrol imkanı hem de muazzam bir hız veriyor.

Hızlı Referans

Basit bir metin düzeltmesi için ajanın yaptığı planlama yükü ve süresi inanılmaz boyutlara ulaşıyor

Ajan koda müdahale ederken yapıdan tamamen kopuk, parça parça ve alakasız değişiklikler uyguluyor

Arayüzdeki görev listesi ajanın arka planda yaptığı asıl çalışmayı ve ilerlemeyi hiçbir şekilde yansıtmıyor

Nokta atışı tek dosya düzenlemelerinde, hızlı bilgi taleplerinde ve ufak format işlerinde mutlaka Hızlı Moda geçin

Projenizin ikiden fazla noktasını etkileyecek her türlü değişiklik için tereddütsüz Planlama Modunu kullanın

Ajanın size sunduğu o Uygulama Planını mutlaka okuyun ve baştan savma duruyorsa kodu reddedip yeni plan isteyin

Model Karşılaştırması, Fiyatlandırma ve Hangisinin Ne Zaman Kullanılacağı

Arka planda çalıştırdığınız zekayı, yani modeli doğru seçmek tam olarak bir satranç hamlesidir; hızı, maliyeti ve akıl yürütme derinliğini iyi dengelemeniz gerekir. Hem Antigravity içinde hem de dışındaki envaiçeşit modeli deneyimlemiş biri olarak kendi pratik kullanım haritamı sunuyorum. ### Amiral Gemisi Gemini 3.1 Pro Preview **Kullandığım Alanlar** Karmaşık ve baştan sona özerk çalışan ajan sınırlarında, ağır refactor operasyonlarında ve derin mimari analizlerde kullanıyorum. **Gördüğüm Riskler** Yanıt gecikmesi ve fatura maliyeti yüksektir. Basit bir "merhaba" yazdırırken bile sistemin aşırı düşünmesini engellemek için akıl yürütme seviyesi parametresini kesinlikle kısmanız gerekir. **Fiyat Etiketi** Milyon jeton başına yaklaşık; girdi tarafında 2,00$ / çıktı tarafında 12,00$ (200k bağlama kadar veriler Nisan 2026'ya aittir). ### Seri Ateş Gemini 3.1 Flash Preview **Kullandığım Alanlar** Kritik hıza ihtiyaç duyduğum asistan kodlamalarında, devasa verilerin hızlıca taşınması gereken döngülerde ve anlık prototiplerde asla şaşmam. **Gördüğüm Riskler** Son derece zeki olsa da, elli farklı adımdan oluşan ultra karmaşık akıl zincirlerinde Pro'nun o sarsılmaz kararlılığını veremez. **Fiyat Etiketi** Milyon jeton başına; girdi tarafında 0,50$ / çıktı tarafında 3,00$. ### Sistematik Güç Claude Opus 4.6 Vertex Üzerinden **Kullandığım Alanlar** Ağır kurumsal analizlerde, kesintisiz ve saatler süren sistematik kodlama oturumlarında devrede. **Gördüğüm Riskler** Çok basit konularda bile devasa düşünme gücü harcaması maliyetleri roketletebilir. Anthropic bile rutin kod işlerinde 'çaba' parametresini özellikle düşürmemizi tavsiye ediyor. **Fiyat Etiketi** Vertex tarafında bölgeye de bağlı olarak; milyon jeton girdi için 5,50$ / çıktı için 27,50$. Sisteme 1.000.000 girdi jetonu ve 128.000 çıktı jetonu kapasitesi veriyor. ### Ağır Abimiz GPT-OSS 120B Vertex MaaS **Kullandığım Alanlar** Kendi donanımınızın çok ötesine geçen o açık kaynak esnekliğini çok uygun bir fiyatla almak istediğimde devreye girer. **Gördüğüm Riskler** Ajanın araçlarla iletişim kurmasını sağlayan şema yapısı çok çabuk bozulabiliyor. Harmony adlı format yapısını çok temiz ve dikkatli bir komut sistemiyle kurmanız şart. **Fiyat Etiketi** Vertex üzerinde milyon jeton girdi sadece 0,09$ / çıktı tarafı ise 0,36$. ### Uç Noktadaki Alternatif GPT-OSS 20B **Kullandığım Alanlar** Altyapı maliyetini doğrudan sıfıra indirmek istediğim o izole yerel sunucu denemelerinde ve uç noktalarda harika bir seçenektir. **Gördüğüm Riskler** Modeli lokalinize indirmek zorundaysanız donanımınız sizi kısıtlar. MXFP4 mimarisinde bile en az 16GB VRAM kapasitesine ihtiyacınız var. *Buraya not düştüğüm tüm fiyat metrikleri sistemin yayına alındığı Nisan 2026'yı temsil ediyor. Kullanmadan önce sağlayıcılarınızın kendi panellerinden fiyatları teyit edin.*

Hızlı Referans

Yapay zeka faturanıza ödediğiniz para yaptığınız işin kalitesine kıyasla aklınıza yatmıyor

Yeni bir projeye başlarken arka planda hangi modeli kurgulayacağınıza bir türlü karar veremiyorsunuz

Claude modelini denediğinizde çok çok basit görevlerde bile beklediğinizden çok daha fazla gecikiyor

Anlık ve pratik günlük kodlamalarınız için doğrudan Gemini Flash'ı seçin; Pro ve Claude versiyonlarını yalnızca ağır mimari analizlerde ateşleyin

Bütçeniz sınırlıysa hiçbir altyapı riski almadan girdi tarafında sadece 0,09$ yakan GPT-OSS 120B Vertex MaaS yapısını kurgulayın

Sistemin gereksiz yere efor harcamasını durdurmak ve hızlandırmak için rutin işlerde Claude'un özel çaba parametresinin seviyesini anında dibe çekin

Claude Opus'u Otonom Kullanım İçin Ayarlamak

Claude Opus 4.6 Antigravity ve Vertex AI içerisindeki performans ve güvenlik dinamikleri çok farklı olduğu için kesinlikle ayrı bir bölümü hak ediyor. ### Çaba Ayarını Kontrol Etmek Anthropic kendi belgelerinde Opus 4.6'nın varsayılan olarak "daha derin" düşündüğünü açıkça belirtiyor. Eğer bu gücü günlük standart kod üretiminde açık bırakırsanız faturanız ve bekleme süreniz mantıksız şekilde şişer. Sistemdeki en kritik ayar olan **çaba** (effort) parametresi işte burada devreye giriyor. Ben rutin her kod işinde Antigravity arayüzünden bu çaba seviyesini en dibe çekiyor, sadece devasa mimari analizlerde yukarı alıyorum. Örnek olarak Vertex AI üzerinden akış (streaming) destekli bir Claude çağrısını inceleyebilirsiniz: ```bash MODEL_ID="claude-opus-4-6" LOCATION="us-central1" PROJECT_ID="YOUR_PROJECT_ID" curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/anthropic/models/${MODEL_ID}:streamRawPredict" \ -d '{ "anthropic_version": "vertex-2023-10-16", "messages": [{"role": "user", "content": "Review this architecture for security gaps."}], "max_tokens": 4096, "stream": true }' ``` ### Web Aramasındaki Risk Claude'un kendine has o web arama yeteneğini (web search) Vertex üzerinden aktif ederseniz sistemin veriyi nasıl işlediğini çok iyi bilmelisiniz. Claude sorduğunuz sorulardan arama niyetleri çıkarıp bunu Anthropic'in belirlediği üçüncü taraf bir sisteme iletir. Google açıkça bu üçüncü tarafın veriyi ne yaptığına dair sorumluluk almadığını yazıyor. Müşteri verileri, tescilli kodlarınız veya dahili şirket sırlarınızla çalışırken bu web aramasını mutlaka tamamen kapalı tutun. Bunu size bir tavsiye olarak değil, doğrudan yazısız bir güvenlik kuralı olarak söylüyorum.

Hızlı Referans

Claude Opus 4.6'yı basit kodlamalarda kullanmak devasa faturalar kesiyor

Kod tabanınız üzerinden yapılan web aramalarının şirket dışına veri sızdırmasından endişe ediyorsunuz

Vertex üzerindeki akış (streaming) istekleriniz kopuyor veya zaman aşımından düşüyor

Ajanı basit işlerde kurarken hemen o çaba (effort) parametresini dibe vurdurup gereksiz düşünmeyi kesin

Projeniz kurumsal gizlilik içeriyorsa üçüncü taraflarla veri paylaşımını kesmek için uygulamanın web arama özelliğini anında devre dışı bırakın

Sisteminizin sınırlarını korumak için Vertex kotalarınızı kontrol edin ve en geniş altyapı desteği için her zaman us-central1 bölgesini hedefleyin

GPT-OSS Yerel Dağıtımı ile Vertex MaaS Karşılaştırması

OpenAI sonunda donanım sınırlarımızı zorlayan o açık ağırlıklı (open-weight) GPT-OSS serisini yayınladı. Geliştirici camiasında çokça konuşulan "Antigravity'ye Ollama bağlayabilir miyim?" sorusunun yanıtı tam olarak bu ailede gizli. Antigravity ana beyni Ollama ile değiştirmenize izin vermez ancak GPT-OSS'i kendi sunucunuza kurarak veya Vertex MaaS üzerinden doğrudan sisteme dışarıdan taze bir zeka olarak sokabilirsiniz. ### Kendi Altyapınıza Hızlı Kurulum OpenAI'ın resmi tarifnamesine göre `transformers` kütüphanesi işi oldukça basit tutuyor: ```bash pip install -U transformers # Yerel bir sunucu başlatın transformers serve # Sisteme bağlanıp sohbet edin transformers chat localhost:8000 --model-name-or-path openai/gpt-oss-20b ``` ### Donanımın Çizdiği Sınırlar Model ailesinin 20B parametreli versiyonunu MXFP4 niceleme tekniğiyle çalıştırırsanız 16GB VRAM gibi makul sınırların içinde kalır. Bu sayede ofisteki RTX 4080 veya 4090 ekran kartınız bile doğrudan ateşleme yapabilir. Ancak sistemi 120B canavarına yükseltirseniz A100 veya H100 kalibresinde 80GB sınıfı kurumsal donanıma ihtiyacınız var. ### Sunum Katmanında vLLM İmzası Ağırlığı ne olursa olsun bu modeli bir üretim katmanına sürecekseniz alt tarafta **vLLM** çalıştırmanızı kesinlikle öneriyorum. OpenAI uyumlu uç noktası sunması bir yana, sisteme FP8 seviyesinde KV önbellek nicelemesi sağlayarak aynı ekran kartında çok daha geniş bağlam ve hız elde etmenize olanak tanır. ### Alternatif Platform Vertex MaaS Modelin altyapı yükü gözünüzü korkutuyorsa, Vertex AI altyapısındaki "Hizmet Olarak Model" (MaaS) platformu imdadınıza koşuyor: ```bash LOCATION="global" PROJECT_ID="YOUR_PROJECT_ID" curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-oss-120b-maas","messages":[{"role":"user","content":"Explain KV cache quantization."}],"max_tokens":500,"stream":true}' \ "https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/endpoints/openapi/chat/completions" ``` Sistemin algılanan hızını (latency) canlı tutmak için yanıtı toplu beklemek yerine bu şekilde akış (stream) olarak almanız şarttır.

Hızlı Referans

Ajanınızın ana model ayarlarına Ollama'yı yerleştirmeye çalışıyor ancak başarısız oluyorsunuz

GPT-OSS'in 20B versiyonunu yerel ortamda denerken kartınızda sürekli VRAM darboğazı oluşuyor

Dev 120B modelini kendi sunucunuza kurmanın donanım ve sunum maliyeti çok anlamsız kalıyor

Sistemin ana modelini kırmaya çalışmak yerine MCP aracılığıyla yerel modellerinizi araca dönüştürüp dışarıdan çağırın

Kartınızda kesin olarak 16GB VRAM olduğundan emin olun ve modeli MXFP4 mimarisiyle sıkıştırarak çalıştırın

Siyah ekranda sunucu yönetmekle uğraşmamak için doğrudan Vertex MaaS sistemine bağlanarak modeli kiralayın

Gelişmiş API Yapılandırmaları Toplu İş Küresel ve Önbellek

Gemini veya Vertex API altyapıları üzerine sistem kurgularken o ayarları doğru yapılandırmanın en az komutu doğru yazmak kadar kritik olduğuna inanıyorum. Sadece ayarları bilmek bile faturayı inanılmaz seviyelerde tutabiliyor. ### Küresel Uç Noktaların Gücü Vertex AI resmi olarak **küresel uç noktaların** o lokal bölgelere kıyasla inanılmaz bir erişilebilirlik sağladığını söylüyor. Verinin ülkeden çıkmaması gerektiği o yasal zorunluluklar hariç, her üretim iş yükünde varsayılan olarak doğrudan küresel sistemi kullanıyorum. Bu sizi özellikle yoğun kullanım saatlerinde bölgesel çökmelerden ve 429 hız sınırı (rate limit) hatalarından anında kurtarır. ### Çıkarım Kademeleri Arasındaki İnce Çizgi Gemini API sisteminin üç ana kademesi var ve bu üçlü arasındaki dengeyi iyi yönetmelisiniz: - **Standart** Dümdüz varsayılan seçim. Bekleme ve maliyet dengesi sağlar. - **Esnek** İnanılmaz ucuz ama sunucu gecikmeleri değişkendir. Ben bunu her zaman arka plandaki toplu veri işleme süreçleri için kullanıyorum. - **Öncelikli** Saniye bile sekmeden doğrudan yanıt almanız gereken ve kullanıcıların beklediği aktif kurgular için biçilmiş kaftan. Sadece bu kademeyi akıllıca kurgulamak bile ekstra komut girmeden maliyeti yüzde otuz ile elli arasında tıraşlıyor. ### Bağlamı İşlemek ve Önbelleğe Almak Sistem aynı veriyi defalarca görüyorsa Vertex AI burada otomatik **örtük** önbelleğe alma yapıyor. Ancak siz sistemi yönetirken kodu açıkça **saklanabilir** formata sokarsanız çok daha kesin bir maliyet düşüşü yaratırsınız. Devasa bir kod mimarisine günlerce sorular sorduğumda arkadaki bağlamı açık olarak önbelleğe kilitliyorum. Sistem her soru için taze jeton yakmak yerine daha ucuza tarifelendirdiği kayıtlı jetonlara başvuruyor. ### Toplu İşlemler Gemini Geliştirici API tarafı devasa okumalar için harika olan **Toplu (Batch) API** mimarisini sunuyor. Zaman sınırım olmayan her türlü test yazımını ve arşiv taramasını doğrudan bu toplu havuza şutluyorum. Maliyet tam yarı yarıya iniyor; tek ödün verdiğim nokta yanıtı anında almamak ki arka planda çalışırken o saniyelerin peşine düşmek son derece saçma. *Maliyetler dalgalıdır, her zaman en temiz karar için komutu çalıştırmadan önce Vertex AI fiyatlandırma sayfasının güncel sürümüne bakın.*

Hızlı Referans

Sisteme istek attıkça Vertex üzerinden sürekli 429 Rate Limit hız sınırı uyarısı alıyorsunuz

Aynı mimari belgelerini okutmanıza rağmen önbelleğe alma mekanizması maliyetinizi hiç düşürmüyor

Toplu iş komutlarınızın işlem süresi sistemdeki anlık çalışmanızı engelliyor

Sisteminize gelen trafik yükünü otomatik dengelemek için projedeki uç noktaları küresel formata geçirin

Açık bağlam önbellekleme kullanıyorsanız komutunuzdaki referans kodunun her soruda istisnasız birebir aynı olduğundan emin olun

Toplu emirleri asla hemen yanıt almanız gereken işlerde kullanmayın ve her zaman arka planda esnek moda bağlayın

Üretim İçin Uç Bulut ve Hibrit Dağıtım Desenleri

Yapay zeka sistemlerini ayağa kaldırırken hangi mimaride yayın yapacağınızı seçmek tamamen o verinin yasallığına, sistemin hız limitlerine ve yapının boyutuna bağlıdır. ### Uç Nokta Kurgusu (İzole GPT-OSS) **Hangi Senaryoda Kusursuz** Verinizin internete asla çıkmaması gereken kurumsal devlet sırrı ayarındaki kapalı projelerde ve 10 milisaniyenin bile altında dönüşe ihtiyaç duyulan sistemlerde mutlak güçtür. **Neden Tercih Etmelisiniz** Donanım, veritabanı ve modellerinizin yüzde yüz hakimi olursunuz. Zaten OpenAI açık ağırlıklı GPT-OSS modellerini kendi sağladığı orijinal API üzerinden barındırmıyor, yani mecburen alıp kendi altyapınızda kendi sisteminizi kurmanız gerekiyor. **Sistemin Bedeli** Kurulum, güncelleme döngüsü ve donanım limitleri sadece sizin sorununuzdur. Özellikle yüksek trafik dönemlerinde operasyonel ekiplere büyük iş çıkarır. ### Bulut Kurgusu (Vertex AI Platformu) **Hangi Senaryoda Kusursuz** Sınırsız ölçeklenmeye ihtiyaç duyan milyarlık kurumsal kitleler ve yönetilen sistemler isteyen yapılar. **Neden Tercih Etmelisiniz** Tek tıkla küresel uç noktalar aktif olur, yerleşik önbelleğe alma sistemleri devreye girer. Sistemi denetleme, hata ayıklama günlüğü alma ve paneller harikadır. **Sistemin Bedeli** İstekler çok fena şiştiği zaman 429 kota kilitlerini yersiniz ve en kötüsü de dışarıya açık web taraması aktifse sağa sola dış veri aktarımı yapan üçüncü partilere yakalanabilirsiniz. ### Melez Hibrit Kurgu (Bulut Zeka ve Yerel Aletler) **Hangi Senaryoda Kusursuz** Aklın sınırlarını buluttaki sistem hesaplasın ama benim verilerime, araçlarıma, o hassas yapılarıma dışarıdan asla kimse erişemesin dediğim projeler için tek seçeneğim. **Neden Tercih Etmelisiniz** Tam olarak MCP'nin olay yarattığı sistemdir. Devasa mantık bulutta çözülür, cevap dönerken aradaki köprü olarak çalışan yerel otonom MCP sunucunuz sizin araçlarınızı yalnızca sizin güvende tuttuğunuz alanda kullanır. **Sistemin Bedeli** Kapsüllerinizdeki o güvenlik kilitleri doğrudan size ait olur. `mcp_config.json` dosyanız sızdırılırsa köprü komple yıkılır.

Hızlı Referans

Geliştirdiğiniz projeye bu dağıtım mimarilerinden hangisinin tam olarak oturduğuna emin değilsiniz

Yapılandırdığınız bulut sunucunun dahili şirket veritabanına erişimi teknik olarak sağlanamıyor

Çalıştırdığınız sistem ofisteki donanımınızın gücünü aşıp darboğaz yaratıyor

Sistemin hızlı yayına girmesi için projeye her zaman Bulut formatıyla başlayın; iş büyüdükçe güvenliği artırmak için Hibrit mimariye taşıyın

Şirket içindeki veritabanınızı internete maruz bırakmamak için her zaman MCP köprüsünü aktif kullanıp veriyi buluta dolaylı yansıtın

Darboğazdaki sistemi kurtarmak için modeli vLLM sunumunda optimize edip dışa açın veya dev canavarları çalıştırmak için hiç zorlamadan Vertex MaaS kullanın

Vertex Ortamında Gözlemlenebilirlik ve Hata Ayıklama

Herhangi bir yapay zeka uygulamasında işler patladığında, bildiğiniz düz komut ekranındaki geleneksel hata satırlarına (stack trace) bakmak hiçbir işe yaramaz. Sistem devasa kapalı bir kutudur; akıl yürütme döngüsünü konsoldan anlık takip edemezsiniz. Hatayı bulmak için çok daha izlenebilir ve kalıcı bir kayıt mantığı kurmanız şarttır. ### Pano Üzerinden Modeli Gözlemlemek Vertex AI platformu sistemin nasıl sömürüldüğünü, ne gecikmeler yaşandığını ve hata oranlarını anında listeleyen harika bir **model gözlem panosu** bulundurur. Çıktıda bir gecikme olduğunda kod bloklarına değil ilk olarak doğrudan bu panoya bakıyorum. Sorunun benim kod yapımda mı, internette mi yoksa donanım altyapısında mı olduğunu en sert şekilde burası yüzüme vuruyor. ### Günlüklerin BigQuery Tarafına Yazılması Uygulama her çuvalladığında arkadaki tüm yük isteklerini (request payload) alıp kelimesi kelimesine BigQuery tablosuna döken **istek/yanıt günlüklemesi** olmazsa olmazım. Ciddi üretim işlerinde bu sistemi tamamen şu üç prensip üzerine oturtuyorum: 1. **Çıplak Gerçek Hata Ayıklama** Sistem saçmaladığında panoyu açar, hatayı oluşturan o orijinal çağrıyı alır ve hatanın nerede olduğunu bulana kadar arka planda tekrar tekrar okutur aynı döngüye sokarım (replay). 2. **Kör Maliyetleri Ayrıştırmak** Ekibimiz sistemi sömürürken o çağrıların her birine **özel etiketlemeler** ekliyorum. Böylece ay sonundaki fatura kabarırsa o hatayı kimin yazdığı özelliğin taşıdığını net olarak görür ve paraziti projenin içinden sökerim. Bunu iş ortaklarının modellerinde yaparsanız sistem hata veriyor, şimdilik sadece kök Google modelleri tam yetkiyle çalışıyor. 3. **Eksiksiz Uyumluluk Güvenliği** Kurumsal hukuk sınırlarında, projedeki her bir kod veya her bir kelime sorgusunun mutlaka kusursuz bir dosya takibine sahip olması şarttır. ### Yerel Hata Ayıklama Çıkmazı Antigravity masaüstü uygulamasında o kayıtları rahat okunur formata çevirecek ve tek standartta dizecek sistemler maalesef yok. Sorunu sistem bazlı yerel ortamda çözmeye kalkarsanız terminalin diplerine ve IDE console paneline inip saatlerinizi harcamak zorundasınız. İş hata ayıklamaya geldiğinde bu yükü yerelin üstüne koymak yerine doğrudan bulutun panellerine güvenin.

Hızlı Referans

Sisteminiz devasa modelden neden alakası bile olmayan saçma sapan bir dönüş aldığını asla açıklayamıyor

Maliyetler arttığında hatanın tam olarak ürünün hangi kısmından veya projedeki kimden kaynaklı olduğunu göremiyorsunuz

Açık unuttuğunuz denetim ve izleme günlükleri projede çok gürültülü ve masraflı hale gelmiş

Sistemin girdiği her çıkmazı tekrar inceleyebilmek (replay) için mutlaka BigQuery alanındaki istek listelemesini açık modda tutun

Kimin ne kadar yük yarattığını izlemek için faturaya dahil edilen API isteklerini ekibe, özelliğe ve projelere özel ayrı ayrı etiketleyin

O büyük izleme kayıtlarını her projeye yaymayın, sadece üretime açık dış API kod bloğuna kısıtlayın test kısımlarında sistemi devreden çıkarın

Araç Zincirine Ayak Uydurmak Kırılgan Şema Değişiklikleri

Yapay zeka ekosistemi kırılım hızıyla değişiyor. Sistemi kurup arkanızı dönerseniz iki yıl içinde kodlarınızdaki görünmeyen çatlaklar (breaking changes) her şeyi fena bozacaktır. Kendi sistemimde tespit ettiğim ve sizin de bilmeniz gereken teknik depremleri buraya katalogluyorum. ### Gemini API Güncellemeleri - Sistemimizdeki en güçlü silah olan `gemini-3-pro-preview` takma adı 2026'da fişi çekilerek komple **kapatıldı**. Sistem bu kodu açık olarak artık `gemini-3.1-pro-preview` modeline sallıyor. Projenizde eski kod katı kodlanmış (hardcoded) halde duruyorsa teknik yönlendirme yüzünden sistem çalışabilir ama yaşanacak sessiz karakter kaymalarını ve hataları önlemek için doğrudan kod bloğunu 3.1 ile güncelleyin. - v1beta tarafındaki Interactions API'sinde faturalandırma motorunun parçaladığı `total_reasoning_tokens` bölümünün ismi doğrudan `total_thought_tokens` olarak değişti. Sürüm yayınlarında yazan kocaman o **kırılgan değişiklik** uyarısını gördüyseniz, arkadaki tüm telemetri kayıt boru hattınızı güncellemeniz şart. ### Antigravity'nin Mimari Çatlakları - Sistem 1.20.3 güncellemesi sonrasında projede yalnızca GEMINI.md okumayı bıraktı ve **AGENTS.md** gibi bir alternatifi tamamen sistem okumalarına dahil etti. - Eski versiyonlardaki adımlar arasında ajanları duraklatan o ince **Otomatik Devam Etme** ayarı sistemden koparıldı; yapay zeka artık varsayılan olarak her projede son hızla durmadan çalışıyor. - Uzun, devasa sohbet konularının belleğe inmesi tarafında çok harika bir **yükleme hızı yapılandırması** olduğu iddia edildi; ama kullanıcı arayüzü çok uzun muhabbetlerde halen deli gibi kasıyor. - Şirket forumlarındaki iddialara göre yapay zekanın satır içi okuma yapmasını sağlayan **"Komut desteğinin kesilmesi"** durumu ortaya çıktı. Sadece bu satır içi komutlardan yürüyen bir yapı üzerine sistem kurguluyorsanız kodun çökmeme garantisini sağlamak için her paketten sonra sistemi gerileme (regression) testine bağlayın. ### Claude Opus Tarafı - Anthropic sistemde çok kilit olan o güçlü **çaba** (effort) sınırını doğrudan kullanılabilir parametre olarak ekledi. Eğer bu parametreyi kod içinde düşük tutmazsanız sistemde çalışan kod çok derin düşünmeye ve arka tarafta paranızı hızlı yakmaya mahkumdur. - Vertex ekosistemine giren Claude bağlantıları direkt web aramasını (web search) devreye soktu. Veriler tescilliyse dış platforma o verileri servis etmeden önce şirketteki kod okuyan tüm veri güvenlikçi yazılımcıları sisteme toplayıp okyanusa neler aktığını kontrol ettirin. ### GPT-OSS Gerçeği - OpenAI yayınladığı GPT-OSS motorlarının o bilinen **ChatGPT pencerelerinden veya resmi API üzerinden bağlanmadığını** kanıtladı. Üreteceğiniz sistem ya gidip o dev modeli kapalı ofis bilgisayarında kuracak ya da Vertex MaaS altyapısına bağlanacak. Sistemin tamamını yekpare OpenAI kütüphenesinde döndürüyorsanız bağlama kodlarınız tamamen boşa çıkacaktır.

Hızlı Referans

Arkadaşların son yayınladığı model yamasından sonra çalışan her şey aniden sessizce çöktü

Firmanın parayı yakan o faturalandırma işlemi hatalı ve tamamen alakasız veri analizleri veriyor

Otonom olarak çalışan ajanınız siz dur veya bekle demeden kod bloğu içindeki tüm o yapılandırılmış mimari adımlarını sonuna kadar zorluyor

Sert formattaki o eski model etiketlerini son versiyonları ile temizleyin; sistem ne kodlarsa kodlasın yeni bir Gemini yamasından sonra projeyi teste sokmayı kural haline getirin

Modeldeki o devasa ismi değişen total_thought_tokens bölümündeki sistem loglarını hızlıca temizleyin

Sürüm notlarında kapatılan o 'otomatik devam' komutunun yerine sistem içinde kontrol için farklı sınırlama parametreleri arayın