أطلقت جامعة هارفارد بالتعاون مع غوغل مبادرة البيانات المؤسسية بهدف نشر مليون كتاب للعامة بشكل مجاني عبر الإنترنت.
والغرض منه هو توفير بيانات دقيقة لتدريب نماذج الذكاء الاصطناعي وبدأت المبادرة بجمع البيانات مما يقرب من مليون كتاب من كتب الملكية العامة التي تم مسحها ضوئيًّا في مكتبة هارفارد كجزء من كتب غوغل وبعد الانتهاء من هيكلة وتحليل المجموعة ركز المشروع على نشر هذا المورد على نطاق واسع بدعم من غوغل ومن ناحية أخرى يحظى هذا المشروع بدعم مالي سخي من OpenAI وMicrosoft كما ستكون هذه الكتب جاهزة للنشر في أوائل عام 2025.