Про индустрию инфобеза

Наверное, самым большим разочарованием в данной индустрии является то, что наша работа не ведёт к улучшениям для человечества в целом. Вот, например, нашёл ты какой-то новый вирус, использующий какую-то шибко замудрённую атаку. Ну, разобрал вирус на запчасти, задокументировал, написал Yara, определил, какой инфраструктурой пользуется вирус. Возможно, даже пролез на сервер крякера ушастого и сгрузил инфу, которую он украл.

И чо теперь?

А ничо. Крякер ушастый как сидел, так и сидит. Передавать информацию в соответствующие органы я права не имею, а у них нет ресурсов заниматься подобными исследованиями самостоятельно. Обратиться к тому, чью инфу украли? А это ещё хуже — прикинь, что бы было, если бы выяснилось, что спёрли данные у крупного банка, например? Это не в интересах банка! Банку будет, наоборот, очень неприятно — они могут даже тебя, такого умного, засудить, мол, ты рассказал всем о наших проблемах, мы теперь потратим мильярд долларов на то, чтобы эту кашу расхлебать.

Единственному, кому от такой работы становится лучше — это тому, кто платит инфобезопаснику. Да, до его данных будет добраться посложней.

Если бы работа в сфере информационной безопасности вела к массовым посадкам киберпреступников, вот тут да, можно было бы сказать, что своей работой чувак или чувиха помогает человечеству. А на данном этапе мы имеем то, что по сути конторы инфобеза живут именно за счёт того, что есть киберпреступники. Они паразитируют на этом срезе отношений между преступниками и их жертвами. И совершенно не в их интересах, чтобы киберпреступников становилось меньше. Похожие обвинения выдвигали против компаний, занимающихся антивирусами, некоторые даже всерьёз считали, что компьютерные вирусы они же и пишут. Это, конечно, не так (им что, больше делать нечего? и так работы дохрена), но факт того, что тот же Касперский лично не заинтересован в том, чтобы вирусы и вирусописатели исчезали, остаётся фактом.

И чего с этим делать?

Лично я считаю, что надо начать с того, чтобы исследователи, занимающиеся данными проблемами, имели бы полный иммунитет от судебных преследований. Тогда как минимум, перестала бы стоять проблема того, что данные о крякерах есть, а сделать с ними ничего нельзя.

Во вторых, надо сделать так, чтобы государство не могло заставить исследователя работать на них. Передавать данные — да, и то только в том случае, если это не принесёт исследователю слишком много хлопот. А то щас можно устроить судебный ордер и опаньки — цельную неделю придётся потратить на то, чтобы удовлетворить не в меру ретивого агента ФБР.

В третьих, надо менять менталитет людей. Вот почему-то никому не приходит в голову стыдиться того, что его ограбили. Какой бы ты здоровый мужик бы не был, а сделать что-то, когда кто-то навёл ствол на твоего ребёнка, например, ты не сможешь. Отдашь бумажник как миленький (и правильно сделаешь).

Но опубликование сведений о том, что у крупной организации украли данные — это, почему-то, считается зазорно и позорно, и все организации (особенно банки) стараются избежать огласки. А не должно быть так.

Я бумеранг

На старой работе не мелочась сразу предложили на 10% больше, чем я сейчас получаю. Чего тут думать, пакую чемоданы. Покамест ментально — так как письмо с офертой у меня будет только на следующей неделе.

Бывает так, что человек остаётся, если видит большую перспективу в своей позиции. Мол, ничо, щас понапряжёмся, зато потом будет круто. У меня нет такого ощущения. Через 5 лет я бы занимался практически тем же самым, как остальные члены моей команды, некоторые из которых работают тут намного дольше меня. Ну, может быть, я бы занимался этим на более высоком уровне.

Возврат на старое место можно рассматривать как откат — мол, не сдюжил. Но это не мой случай. Я честно отработал год с гаком, а больше так не хочу. Это просто не моё. Потом, я возвращаюсь на лучшие условия, во всяком случае, по деньгам — какой же это откат и провал?

Что скажете, благородные доны? Кто из вас возвращался на старое место работы?

Да блин

В очередной раз назревают мысли о уходе с текущего места работы. Ну, не могу я терпеть рутинную работу, поточную. А она именно такая — поточная. После анализа нескольких десятков активных вирусов меня можно очень мало чем удивить. Новое появляется очень редко.

Поначалу было интересно, а щас — уже нет.

Всерьёз думаю о возврате к сисадминству. Как назло, опять со старой работы позвонили — “ты там не передумал?” В самом деле, вернуться, что ли? Если денег больше дадут?

Чем больше ML, тем толще данные

Пробую сделать крутой, как обрыв, проект с машинным обучением.

Картинка с Вики
Вот вы как думаете, что тут самое сложное? Само машинное обучение? А вот нифига. Это как раз самое простое — это меньше сотни строчек Питоновского кода, благо TensorFlow со всем его API уже давно придуман до нас намного более умными людьми. А самое сложное — это подготовка данных, которые надо скармливать алгоритмам машинного обучения. Потому что оно, блин, довольно требовательное. Скажем, для регрессивного анализа очень хорошо, если данные имеют нормальное распределение. Иначе могут возникнуть разные, не всегда хорошие, эффекты. Данные, взятые из реального мира часто нормального распределения не имеют. И приходится сидеть и шаманить, пока не нашаманишь чего-то более удобноваримого.

Это было серьёзным открытием лично для меня — насколько важно иметь начала образования именно в науке о данных (data science), чтобы построить нормальную систему ML. Хотя казалось бы, всё упирается в программирование. А вот хрен! И, блин, именно в этой области у меня есть довольно большие пробелы — максимум из применимого был начальный курс статистики, который я брал в 2011 году.

Кроме того, есть данные, у которых в принципе не бывает никакого распределения — скажем, список используемых программой функций. О каком распределении тут может идти речь? Либо эти функции есть, либо их нет. Как с этим работать? Чешу репу…

И на закуску Офис 2016 на Макинтоше — это кастрат. Скажем, мне нужна иерархическая визуализация данных. В виндовой версии экселя есть замечательная диаграмма “солнечный луч” — она похожа на круговую, но она многоуровневая, и позволяет, таким образом, также визуализировать иерархию. В экселе для Мака — шЫш с маслом, а не солнечный луч. Там вообще никаких иерхархических диаграмм нет.

Ну что за подход такой?