Машинне навчання допоможе знайти нові ферромагнетики

Ірландські фізики розробили і навчили модель, яка пророкує температуру Кюрі у ферромагнетика, відштовхуючись тільки від його хімічного складу. У 83 відсотках модель помиляється менш ніж на 100 кельвінів, що дозволяє шукати за її допомогою перспективні високотемпеолог ні ферромагнітні матеріали. Стаття опублікована в, коротко про неї повідомляє, препринт роботи викладено на сайті arXiv.org.


В даний час фізикам відомо понад 2500 ферромагнетиків, що автоматично робить їх найпоширенішим класом магнітних матеріалів. На мікроскопічному рівні ферромагнетик розбивається на домени - грубо кажучи, на дрібні неподільні магнітики. Якщо температура ферромагнетика порівняно невелика, всі магнітики дивляться в один і той же бік, їх поле складається і посилюється, і в результаті намагніченість ферромагнетика виходить великою - досить великою, щоб ферромагнетики випадково виявили ще дві з половиною тисячі років тому. Однак при підвищенні температури магнітики починають «тремтіти», їх поле складається вже не так ефективно, і намагніченість матеріалу починає падати. Якщо температура перевищить певне критичне значення, «тремтіння» стане занадто сильним, і ферромагнетик розмагнітиться. Цю критичну температуру називають температурою Кюрі.


На жаль, більшість ферромагнетиків мають занадто низьку температуру Кюрі, щоб їх можна було застосовувати на практиці. Більше половини відомих ферромагнітних матеріалів втрачають свої властивості при температурі нижче кімнатної, до «практичних» температур більше трьохсот градусів Цельсія доживає лише мала частина від багатого класу ферромагнетиків, а позначку в тисячу градусів Цельсія долає тільки чистий кобальт. З огляду на цей факт, фізики продовжують шукати нові високотемпáні магніти. Цікаво, що простір для пошуків досить великий: за винятком благородних газів і радіоактивних елементів, практично кожен іон з таблиці Менделєєва може утворити ферромагнетик, якщо помістити його в відповідну кристалічну решітку.

Через це багатство більшість пошуків нових магнітів ведеться теоретично, за допомогою чисельного моделювання. На жаль, залежності, які пов'язують температуру Кюрі матеріалу з його будовою і хімічним складом, далеко не очевидні. Більша частина таких залежностей носить чисто емпіричний характер. Наприклад, температури Кюрі сплавів типу Co2XY можна описати за допомогою кривої Слетера-Полінга, а температури Кюрі аналогічних сплавів з марганцем слідують кривим Кастеліца-Каномата. Це пов'язано з тим, що стандартні методи, включаючи досить потужну теорію функціоналу щільності, не можуть отримати інформацію про температуру Кюрі з будови матеріалу, хоча і можуть розрахувати інші його властивості. Тому фізикам, які шукають високотемп... магніти, досі доводиться керуватися емпіричними правилами, які можуть упускати перспективні регіони. В результаті велика частина зусиль витрачається на дослідження матеріалів з низьким практичним потенціалом.

Фізики Джеймс Нельсон (James Nelson) і Стефано Санвіто (Stefano Sanvito) частково вирішили цю проблему за допомогою машинного навчання. Вчені розробили і натренували модель, яка пророкує температуру Кюрі матеріалу, відштовхуючись від його хімічної формули. Похибка передбачень такої моделі склала близько 50 кельвінів. Більш того, нейромережа дуже добре екстраполювала мізерні вихідні дані на нові області.

Оскільки залежність між температурою Кюрі і хімічним складом ферромагнетика не цілком зрозуміла, фізики максимально розширили область параметрів, з якими працювала модель. В результаті вчені отримали 129-мірний вектор параметрів. Цей вектор включав 84 числа, що описують атомну частку кожного можливого елемента, який може входити до складу ферромагнетика. Оскільки на практиці матеріал складається з одного, двох або трьох елементів, для реальних сполук практично всі ці числа дорівнюють нулю. Це вказує на те, що інформацію про з'єднання можна зберігати і обраховувати більш ефективно. Тому до цих 84 числа вчені додали ще 45 параметрів, описують атомне число, групу, період, число валентних електронів, молярний об'єм, температуру плавлення і споріднення до електрону, усереднені по атомах з'єднання, а потім «урізали» вектор, виділивши в ньому тільки найважливіші параметри. Цікаво, що при грамотному «урізанні» ефективність роботи моделі практично не змінювалася - навіть у тому випадку, якщо від вихідних 129 параметрів залишалося всього 10.

Для навчання та перевірки моделі вчені використовували 2500 ферромагнетиків, зібраних з чотирьох різних джерел. Сполуки з однаковим хімічним складом, але різною кристалічною структурою фізики вважали одним і тим же матеріалом, тому температура Кюрі «складового» ферромагнетика могла досить значно коливатися. Наприклад, матеріал з хімічною формулою Sm2Ni17 може втрачати ферромагнітні властивості як при 186, так і при 641 кельвіні. Щоб мінімізувати ефект таких коливань, вчені привласнювали «складовим» ферромагнетикам медіанну температуру. Втім, варто відзначити, що для більшості матеріалів розкид був порівняно невеликий: у 80 відсотків ферромагнетиків температура Кюрі вкладалася в інтервал завширшки близько 50 кельвінів, і лише у 5 відсотків розкид температур перевищував 300 кельвінів.

Оскільки отримана вибірка з 2500 ферромагнетиків була порівняно невелика, вчені об'єднали тренувальний (training) і тестовий (validation) набори даних. Нагадаємо, що на тренувальному наборі даних модель налаштовує параметри, а на тестовому наборі - гіперпараметри, тобто параметри, які задаються до початку навчання. Щоб підвищити ефективність навчання, в ці (збігаються) набори даних дослідники намагалися відібрати якомога більше різних сполук (і навіть додали до них немагнітні з'єднання). Розмір тренувально-тестового набору склав 1866 з'єднань. За допомогою 767 сполук фізики перевіряли ефективність навченої моделі.


Як модель машинного навчання вчені використовували чотири різні алгоритми: метод регуляризації Тихонова (ridge regression), нейромережа, випадковий ліс (random forest) і регресію ядра хребта (kernel ridge regression). Останні два методи впоралися з передбаченнями найкраще: у 59 відсотках випадків вони передбачили температуру Кюрі з точністю близько 50 кельвінів і ще в 24 відсотках помилилися менш ніж на сто кельвінів. Варто відзначити, що «ламався» алгоритм тільки на ферромагнетиках з низькою температурою Кюрі, які не мають практичної користі. Більш того, модель дуже добре екстраполювала мізерні початкові дані: всього по двох точках вона практично ідеально відновлювала криві, на яких лежать ферромагнітні сполуки різних елементів.

Таким чином, за допомогою побудованої моделі цілком можна шукати нові з'єднання. Втім, для більшої точності в неї слід включити дані про структуру матеріалу. Крім того, було б непогано розібратися, як саме модель пророкує температуру.

Останнім часом нейронні мережі стали так популярні, що їх намагаються застосувати буквально скрізь, де тільки можна. Фізиків ця мода також не обійшла стороною. Зокрема, фізики вже навчили нейромережі вважати функціональні інтеграли і топологічні інваріанти, вирішувати квантову проблему багатьох тіл, виправляти помилки в квантових комп'ютерах, шукати розпади бозона Хіггса і передбачати зростання кристалів. Більш того, деякі нейромережі не гірше людей «розуміють» суть фізичних процесів у статистичних системах, тобто виділяють ступені свободи, які визначають її фізичні властивості.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND