Лонгрид про нейросети

Поре­ко­мен­дую инте­рес­ную ста­тью про воз­мож­ные гря­ду­щие огра­ни­че­ния в обла­сти обу­че­ния ней­ро­се­тей. Я в своё вре­мя мно­го с ними играл­ся; самым инте­рес­ным про­ек­том с моим уча­сти­ем был поиск потен­ци­аль­ных тер­ро­ри­стов в Фейс­бу­ке с при­ме­не­ни­ем ней­ро­се­тей. Модель, разу­ме­ет­ся, делал уже не я, а про­сто немно­го пере­пи­лил гуг­лов­ский Inception. При помо­щи ней­ро­се­тей мож­но решать про­бле­мы, кото­рые очень слож­но алго­рит­ми­зи­ро­вать. Так, этот комикс xkcd уже не явля­ет­ся такой уж про­бле­мой.

В ста­тье доволь­но подроб­но раз­би­ра­ют­ся потен­ци­аль­ные заты­ки тех­но­ло­гии. И самым боль­шим заты­ком сей­час явля­ет­ся огра­ни­че­ние по коли­че­ству пара­мет­ров, кото­рое сей­час быст­ро рас­тёт. Если мы возь­мём обыч­ную пол­но­стью свя­зан­ную ней­ро­сеть в 20 сло­ёв с 10 000 ней­ро­на­ми в каж­дом слое — что­бы эту сеть запу­стить, нам потре­бу­ет­ся при­мер­но 5.7E+66 тера­байт опе­ра­тив­ной памя­ти. Таких мощ­но­стей у нас нет и не пред­ви­дит­ся, так что тупое нара­щи­ва­ние пара­мет­ров ней­ро­се­ти что­бы полу­чить более инте­рес­ные резуль­та­ты — это путь одно­знач­но тупи­ко­вый.

Поэто­му дела­ют­ся свёр­точ­ные сети, суб­дис­кре­ти­за­ции, под­вы­бор­ки, и про­чее шаман­ство, кото­рым по-насто­я­ще­му хоро­шо в мире вла­де­ет очень неболь­шое коли­че­ство людей.

Автор, одна­ко, доволь­но опти­ми­сти­чен, и воз­ла­га­ет надеж­ды на хард­вер­ные, в том чис­ле и ана­ло­го­вые вычис­ле­ния.