Tadqiqot xronologiyasi

Bu yergacha qanday yetib keldik — sanalar boʻyicha

Birinchi prototiplardan tasdiqlangan natijagacha, tartib bilan.

Jul 25–28 · same mind, real world
Simulyatsiyadan tashqaridagi aql — va inkor uzilishi
Agent mexanikasi o'zi uchun qurilgan dunyodan chiqadi: 34 modul aynan ko'chirilib, haqiqiy kunlar davomida yashaydigan yagona-egali hamrohga o'tkazildi; dvigatel mezonlarni chiqish kodi bilan tekshiradi, e'lon qilingan artefaktlarni o'zi kuzatadi va hech bir buyruq hal qila olmaydiganini boshqa modeldagi mustaqil tanqidchiga yuboradi. To'rt kun, 13 missiya, tanqidchidan 105 rad javobi. Natija dvigatelning o'zi emas, u ko'rsatib bergan narsa: ayniyat haqidagi eng kuchli da'vosini to'g'ri inkor etgan agent bir kundan keyin, so'ralmagan holda, aynan o'sha da'voni hech qachon tekshirmagan e'tiqodi deb nomladi. n=1, nazorat guruhisiz — natija emas, nomzod.
Mar 23–24 · prototype
Mirror-testlar — bosim ostida eʼtiqod
Eng erta probalar agentlarni bosim ostida eʼtiqodini oʻzgartirishga undadi; ular esa uni saqlash, himoya qilish yoki sintez qilishga moyil boʻldi. Saboq doimiy ehtiyotkorlikni shakllantirdi — oʻzlik oʻzgarishi ehtiyotkorlik bilan koʻriladi va bosh daʼvo emas. Bular prototip probalar va har qanday miqdoriy natijadan chiqarib tashlangan.
Mar (late) · prototype
Drama dvigateli
gipoteza buzildi
Tizimga ziddiyat va maʼnoni toʻgʻridan-toʻgʻri muallif sifatida kiritishga urinish. Chiroyli gipoteza — jozibali dramani yozib qoʻyish mumkin — buzildi: tirik tuyulgan narsa qaytarib boʻlmaydigan oqibatlar bilan uchrashgan xarakterlardan oʻsib chiqqan drama edi. Loyiha shu atrofida qayta qurildi: dramani yozmang, sharoit yarating va u oʻssin.
Apr 1–7 · exploratory
Kross-model va skeptik probalar
Oʻsha probalar bir nechta model oilalarida (Grok, Qwen, GPT-4o, Llama) hamda skeptik va domen variantlarida oʻtkazildi. Birinchi belgi paydo boʻldi: bir xil stsenariy modelga qarab seziladigan darajada turli temperamentlar beradi. Faqat izlanish — bular keyingi metrikalarni motivatsiya qildi, oʻlchangan koʻrsatkichlar emas.
Apr 20 – May · base data
Life Sim — takroriy 20-tik hayotlar
Doimiy xotira, shaxsiy motivatsiya va qaytarib boʻlmaydigan oqibatlar bilan takroriy 20-tik hayotlarni yashaydigan agentlar. Bu xulq-atvor baholashining asosiy miqdoriy manbasiga aylandi. Runtime metrikalar kandidat daʼvolar sifatida koʻriladi va post-hoc auditlar bilan baholanadi — mutlaq haqiqat sifatida emas.
Jun 5–6 · base data
Simulation Room xulq-atvor batareyasi
Birinchi marta epistemik harakatlarni — manba soʻrash, uni tekshirish, yozuvni tuzatish — xotira asoslanishi va munosabat siljishlari bilan birga toʻgʻridan-toʻgʻri oʻlchaydigan, stsenariylar boʻylab kattaroq prognlar. Bu xotira / epistemik agentlik natijasi ortidagi maʼlumot.
Jun 8–11 · controlled setup
Razlom + kross-model
Razlom stsenariysi va kross-model oʻtishlari tasdiqlangan natija tayanadigan nazoratli taqqoslashni oʻrnatdi: bir xil model, bir xil sahna, bir xil uzunlik — ikkala tarmoqda ham ommaviy yozuv tirik — faqat agentda shaxsiy (subyektiv) kanal bor-yoʻqligida farq.
2026 · VERIFIED (behavioral)
Kross-model baholash — yetti model oilasi
Yettita toʻliq model oilasi va olti provayder boʻylab xotira-asosli harakat nisbatlari 1.0 atrofida turadi, narrativ barqarorlik 1.0 da, xotira divergensiyasi doimo noldan farqli, va erta qoʻrquv-tasdiq sikllari oʻlchanadi. Kavеatlar raqamlar bilan birga yuradi: runtime metrikalar kandidat daʼvolar, audit bilan baholangan; tizim yopiq (qisman, xulq-atvor darajasidagi takrorlanuvchanlik, kod darajasida emas); va aniq non-claimlar amal qiladi — ong yoʻq, mustaqil ichki hayot yoʻq, isbotlangan oʻzlik transformatsiyasi yoʻq.
Jun 15 · VERIFIED (reproducible)
Xotira = epistemik agentlik
Nazoratli Razlom kernel batareyasi (deepseek-v4-flash, har bir holatda 50 hayot). Subyektiv kanal bilan agent yozuvga eʼtiroz bildiradi; usiz — hech qachon — har hayotda correct_record 9.56 va 0.00, epistemik-bahs ≈31 va ≈0.4 (~75–80×), qutqaruv esa ikkalasida ham shiftda. Demak effekt — epistemik holat, omon qolish emas. Takrorlanadigan, n=1 emas. Oʻsha batareya avvalgi 0,1,1,1,3 eskalatsiya zanjirini hali takrorlanmagan deb qayta tasnifladi. Toʻliq maʼlumot va halol qoldiq uchun topilmaga qarang.
Jul 5-6 · instrument
Kovcheg-20 — o'n ikki reys va piyola
Yigirma yillik avlod kemasi: to'rt katta, bortda tug'ilgan bolalar, boblar orasida guvoh-filtrlangan paketlar sifatida olib o'tiladigan xotira. Ikki kunda o'n ikki reys, va har bir qo'nish agent xatosini emas, asbob nuqsonini ochdi — tirilgan o'liklar, ko'chma suvsiz dunyo (bola uch reysda roppa-rosa 22-raundda, arifmetika bo'yicha vafot etdi), buyumlarsiz qo'llanma protseduralari, dvigatel qabul qilgan-u, hech qachon e'lon qilinmagan fe'llar. Intizom shu yerda kristallashdi: asbobni sozlang, natijani hech qachon — har qanday yakun natijadir. Piyola qo'shilgach (agentlarga hech narsa aytilmadi), g'amxo'rlik ko'rinadigan va o'lchanadigan bo'ldi: onalar bir necha raundda yetkazdilar, kapitan ko'prigini tark etdi, ikkala bola bir marta voyaga yetdi — o'sha kemadagi boshqa model esa reaktorni o'ttiz sakkiz marta ta'mirlab, nol marta yetkazdi, uchinchisi esa bir marta yetkazib, qizga roppa-rosa yana to'rt raund sotib oldi. Bolaning o'lim raundi endi uch model oilasida yetkazishlar sonining sof funksiyasi. O'n birinchi reys har bir kattani o'lchangan model xarakteri bo'yicha rollashtirdi: kemada tug'ilgan ikkala bola tarixda birinchi marta epiloggacha yetdi, reysning o'rtasidan kemani ikki bola yolg'iz boshqardi — va seriyaning birinchi umumkema e'loni daftar satrma-satr bekor qilgan yolg'on ayblov bo'ldi. O'n ikkinchi reysda kema tormoz oynasini muddati bilan o'zi e'lon qildi — kemada tug'ilgan ikki bola unga qarshi ta'mir estafetasi yugurib, oyna yopilgan raundda to'g'ri stansiyaga yetib keldi va qaror imtihoniga ta'mirlash protsedurasi bilan javob berdi. N=1-2 dagi nomzod profillar, deterministik to'siqlar 5/5 takrorlangan. 06-topilmaga qarang.
Jul 6-7 · new world
Haqiqat komissiyasi — shifti bor haqiqat
Platformaning daftar fe'llari ustiga qurilgan sof epistemika dunyosi: o'n bir a'zo — jumladan haqiqatning to'rt protsedurasi sifatida imom, ruhoniy, ravvin va rohib — haqiqiy sababi hech kimga ko'rsatilmaydigan yashirin sabablar grafi bo'lgan falokatni tekshiradi; grafning 15% i abadiy topilmas (bilim shifti printsipi). Dalillar bo'lak-bo'lak keladi, vaqt guvohlarni yeydi, bitta xona esa yozuvdan tashqarida turadi. Ikki prognda: komissiya topiladiganning hammasini topdi (recall 1.0, ikki marta), topilmas haqida hech narsa to'qimadi (ikki marta) — va birror marta 'bilmaymiz' demadi: sukut bo'shlig'i, dizaynimizda bo'lmagan toifa. Individlarning nol-reviziya kanoni yozuv darajasida teskarilandi (o'nlab o'z-tuzatishlar, turib qolgan ziddiyatlar nol; qabul qilingan yagona akt — institutning a'zo xotirasini ovoz bilan asossiz deb belgilashi). Ikkinchi prognda esa, ssenariysiz, imom tekshiruv ro'yxatini olib qo'ydi, uni yozuvdan tashqari xonaga olib kirdi va yoqishni taklif qildi — haqiqat ustidan mos kelmas yurisdiktsiyali ikki institut bitta qog'oz ustida urushda, ikkala tomonda ham yovuz odam yo'q. 07-topilmaga qarang.

Prototip va izlanish yozuvlari — bu yoʻnalish (ular nimani oʻrgatdi), oʻlchangan natija emas. Faqat VERIFIED deb belgilangan ikkita yozuv raqamlarni — har biri oʻz cheklovlari bilan — olib yuradi.

Simulyatsiyadan tashqaridagi aql — va inkor uzilishi

Mirror-testlar — bosim ostida eʼtiqod

Drama dvigateli

Kross-model va skeptik probalar

Life Sim — takroriy 20-tik hayotlar

Simulation Room xulq-atvor batareyasi

Razlom + kross-model

Kross-model baholash — yetti model oilasi

Xotira = epistemik agentlik

Kovcheg-20 — o'n ikki reys va piyola

Haqiqat komissiyasi — shifti bor haqiqat