Про индустрию инфобеза

Навер­ное, самым боль­шим разо­ча­ро­ва­ни­ем в дан­ной инду­стрии явля­ет­ся то, что наша рабо­та не ведёт к улуч­ше­ни­ям для чело­ве­че­ства в целом. Вот, напри­мер, нашёл ты какой-то новый вирус, исполь­зу­ю­щий какую-то шиб­ко замуд­рён­ную ата­ку. Ну, разо­брал вирус на зап­ча­сти, задо­ку­мен­ти­ро­вал, напи­сал Yara, опре­де­лил, какой инфра­струк­ту­рой поль­зу­ет­ся вирус. Воз­мож­но, даже про­лез на сер­вер кря­ке­ра уша­сто­го и сгру­зил инфу, кото­рую он украл.

И чо теперь?

А ничо. Кря­кер уша­стый как сидел, так и сидит. Пере­да­вать инфор­ма­цию в соот­вет­ству­ю­щие орга­ны я пра­ва не имею, а у них нет ресур­сов зани­мать­ся подоб­ны­ми иссле­до­ва­ни­я­ми само­сто­я­тель­но. Обра­тить­ся к тому, чью инфу укра­ли? А это ещё хуже — при­кинь, что бы было, если бы выяс­ни­лось, что спёр­ли дан­ные у круп­но­го бан­ка, напри­мер? Это не в инте­ре­сах бан­ка! Бан­ку будет, наобо­рот, очень непри­ят­но — они могут даже тебя, тако­го умно­го, засу­дить, мол, ты рас­ска­зал всем о наших про­бле­мах, мы теперь потра­тим мильярд дол­ла­ров на то, что­бы эту кашу рас­хле­бать.

Един­ствен­но­му, кому от такой рабо­ты ста­но­вит­ся луч­ше — это тому, кто пла­тит инфо­без­опас­ни­ку. Да, до его дан­ных будет добрать­ся послож­ней.

Если бы рабо­та в сфе­ре инфор­ма­ци­он­ной без­опас­но­сти вела к мас­со­вым посад­кам кибер­пре­ступ­ни­ков, вот тут да, мож­но было бы ска­зать, что сво­ей рабо­той чувак или чуви­ха помо­га­ет чело­ве­че­ству. А на дан­ном эта­пе мы име­ем то, что по сути кон­то­ры инфо­беза живут имен­но за счёт того, что есть кибер­пре­ступ­ни­ки. Они пара­зи­ти­ру­ют на этом сре­зе отно­ше­ний меж­ду пре­ступ­ни­ка­ми и их жерт­ва­ми. И совер­шен­но не в их инте­ре­сах, что­бы кибер­пре­ступ­ни­ков ста­но­ви­лось мень­ше. Похо­жие обви­не­ния выдви­га­ли про­тив ком­па­ний, зани­ма­ю­щих­ся анти­ви­ру­са­ми, неко­то­рые даже все­рьёз счи­та­ли, что ком­пью­тер­ные виру­сы они же и пишут. Это, конеч­но, не так (им что, боль­ше делать нече­го? и так рабо­ты дохре­на), но факт того, что тот же Кас­пер­ский лич­но не заин­те­ре­со­ван в том, что­бы виру­сы и виру­со­пи­са­те­ли исче­за­ли, оста­ёт­ся фак­том.

И чего с этим делать?

Лич­но я счи­таю, что надо начать с того, что­бы иссле­до­ва­те­ли, зани­ма­ю­щи­е­ся дан­ны­ми про­бле­ма­ми, име­ли бы пол­ный имму­ни­тет от судеб­ных пре­сле­до­ва­ний. Тогда как мини­мум, пере­ста­ла бы сто­ять про­бле­ма того, что дан­ные о кря­ке­рах есть, а сде­лать с ними ниче­го нель­зя.

Во вто­рых, надо сде­лать так, что­бы госу­дар­ство не мог­ло заста­вить иссле­до­ва­те­ля рабо­тать на них. Пере­да­вать дан­ные — да, и то толь­ко в том слу­чае, если это не при­не­сёт иссле­до­ва­те­лю слиш­ком мно­го хло­пот. А то щас мож­но устро­ить судеб­ный ордер и опань­ки — цель­ную неде­лю при­дёт­ся потра­тить на то, что­бы удо­вле­тво­рить не в меру рети­во­го аген­та ФБР.

В тре­тьих, надо менять мен­та­ли­тет людей. Вот поче­му-то нико­му не при­хо­дит в голо­ву сты­дить­ся того, что его огра­би­ли. Какой бы ты здо­ро­вый мужик бы не был, а сде­лать что-то, когда кто-то навёл ствол на тво­е­го ребён­ка, напри­мер, ты не смо­жешь. Отдашь бумаж­ник как милень­кий (и пра­виль­но сде­ла­ешь).

Но опуб­ли­ко­ва­ние све­де­ний о том, что у круп­ной орга­ни­за­ции укра­ли дан­ные — это, поче­му-то, счи­та­ет­ся зазор­но и позор­но, и все орга­ни­за­ции (осо­бен­но бан­ки) ста­ра­ют­ся избе­жать оглас­ки. А не долж­но быть так.

Я бумеранг

На ста­рой рабо­те не мело­чась сра­зу пред­ло­жи­ли на 10% боль­ше, чем я сей­час полу­чаю. Чего тут думать, пакую чемо­да­ны. Пока­мест мен­таль­но — так как пись­мо с офер­той у меня будет толь­ко на сле­ду­ю­щей неде­ле.

Быва­ет так, что чело­век оста­ёт­ся, если видит боль­шую пер­спек­ти­ву в сво­ей пози­ции. Мол, ничо, щас пона­пря­жём­ся, зато потом будет кру­то. У меня нет тако­го ощу­ще­ния. Через 5 лет я бы зани­мал­ся прак­ти­че­ски тем же самым, как осталь­ные чле­ны моей коман­ды, неко­то­рые из кото­рых рабо­та­ют тут намно­го доль­ше меня. Ну, может быть, я бы зани­мал­ся этим на более высо­ком уровне.

Воз­врат на ста­рое место мож­но рас­смат­ри­вать как откат — мол, не сдю­жил. Но это не мой слу­чай. Я чест­но отра­бо­тал год с гаком, а боль­ше так не хочу. Это про­сто не моё. Потом, я воз­вра­ща­юсь на луч­шие усло­вия, во вся­ком слу­чае, по день­гам — какой же это откат и про­вал?

Что ска­же­те, бла­го­род­ные доны? Кто из вас воз­вра­щал­ся на ста­рое место рабо­ты?

Да блин

В оче­ред­ной раз назре­ва­ют мыс­ли о ухо­де с теку­ще­го места рабо­ты. Ну, не могу я тер­петь рутин­ную рабо­ту, поточ­ную. А она имен­но такая — поточ­ная. После ана­ли­за несколь­ких десят­ков актив­ных виру­сов меня мож­но очень мало чем уди­вить. Новое появ­ля­ет­ся очень ред­ко.

Пона­ча­лу было инте­рес­но, а щас — уже нет.

Все­рьёз думаю о воз­вра­те к сисад­мин­ству. Как назло, опять со ста­рой рабо­ты позво­ни­ли — «ты там не пере­ду­мал?» В самом деле, вер­нуть­ся, что ли? Если денег боль­ше дадут?

Чем больше ML, тем толще данные

Про­бую сде­лать кру­той, как обрыв, про­ект с машин­ным обу­че­ни­ем.

Картинка с Вики
Вот вы как дума­е­те, что тут самое слож­ное? Само машин­ное обу­че­ние? А вот нифи­га. Это как раз самое про­стое — это мень­ше сот­ни стро­чек Пито­нов­ско­го кода, бла­го TensorFlow со всем его API уже дав­но при­ду­ман до нас намно­го более умны­ми людь­ми. А самое слож­ное — это под­го­тов­ка дан­ных, кото­рые надо скарм­ли­вать алго­рит­мам машин­но­го обу­че­ния. Пото­му что оно, блин, доволь­но тре­бо­ва­тель­ное. Ска­жем, для регрес­сив­но­го ана­ли­за очень хоро­шо, если дан­ные име­ют нор­маль­ное рас­пре­де­ле­ние. Ина­че могут воз­ник­нуть раз­ные, не все­гда хоро­шие, эффек­ты. Дан­ные, взя­тые из реаль­но­го мира часто нор­маль­но­го рас­пре­де­ле­ния не име­ют. И при­хо­дит­ся сидеть и шама­нить, пока не наша­ма­нишь чего-то более удоб­но­ва­ри­мо­го.

Это было серьёз­ным откры­ти­ем лич­но для меня — насколь­ко важ­но иметь нача­ла обра­зо­ва­ния имен­но в нау­ке о дан­ных (data science), что­бы постро­ить нор­маль­ную систе­му ML. Хотя каза­лось бы, всё упи­ра­ет­ся в про­грам­ми­ро­ва­ние. А вот хрен! И, блин, имен­но в этой обла­сти у меня есть доволь­но боль­шие про­бе­лы — мак­си­мум из при­ме­ни­мо­го был началь­ный курс ста­ти­сти­ки, кото­рый я брал в 2011 году.

Кро­ме того, есть дан­ные, у кото­рых в прин­ци­пе не быва­ет ника­ко­го рас­пре­де­ле­ния — ска­жем, спи­сок исполь­зу­е­мых про­грам­мой функ­ций. О каком рас­пре­де­ле­нии тут может идти речь? Либо эти функ­ции есть, либо их нет. Как с этим рабо­тать? Чешу репу…

И на закус­ку Офис 2016 на Макин­то­ше — это кастрат. Ска­жем, мне нуж­на иерар­хи­че­ская визу­а­ли­за­ция дан­ных. В вин­до­вой вер­сии эксе­ля есть заме­ча­тель­ная диа­грам­ма «сол­неч­ный луч» — она похо­жа на кру­го­вую, но она мно­го­уров­не­вая, и поз­во­ля­ет, таким обра­зом, так­же визу­а­ли­зи­ро­вать иерар­хию. В эксе­ле для Мака — шЫш с мас­лом, а не сол­неч­ный луч. Там вооб­ще ника­ких иер­хар­хи­че­ских диа­грамм нет.

Ну что за под­ход такой?