وفقاً لما ذكرته Beating، أظهر باحث ما بعد التدريب في OpenAI بول غارنييه أن Codex 5.5 قادر على توليد شفرة تحكم قابلة للتفسير يتفوق أداؤها على نماذج التعلم المعزز العميق الأساسية في تطبيقات ميكانيكا الموائع. وبدلاً من تدريب شبكات عصبية، استخدم غارنييه النموذج لتحسين شيفرات بايثون بشكل تكراري عبر تحليل محاكاة فيزياء، محققاً أداءً أفضل في أكثر من نصف السيناريوهات التي جرى اختبارها.
كانت قواعد التحكم المتولدة بالذكاء الاصطناعي قابلة للتفسير فيزيائياً، مثل "تأخير حقن النفاثة عندما تتجاوز الانحناءة الموضعية عتبة". وعلى عكس صناديق الذكاء الاصطناعي السوداء للشبكات العصبية، أثبت النهج القائم على الشفرة متانةً تحت تغيّر التوزيع؛ وعند تمديد مدة الاختبار أربع مرات، انهارت نماذج DRL التقليدية بينما ظلّ الرمز المستند إلى الفيزياء ثابتاً. استهلك تنفيذ استراتيجية التحكم الكاملة 21.25 مليون رمز، بإجمالي يقل عن 14 دولاراً.