AI安全系列

April 4th, 2020

前言

老样子,AI安全其实是要懂AI,其实可能谈不上AI。或许只算是机器学习和深度学习。然后无论是机器学习和深度学习,其背后的原理又是数学。当然,作为应用者,可能不是很了解机器学习在数学层面的演进。但是要对各种算法有个基础的了解。目前并没有好的讲述ai安全的书籍,我甚至看到有不少人拿textCNN, lstm, rnn去水webshell的检测论文。风气可见一般,当然也不能全盘否定。AI安全有去挖框架本身漏洞的,有去利用AI攻击检测算法的等等。挖框架漏洞在此也先不讲。

书单

统计学习方法 好书,刚出了第二版就重新入手了一本。从数学的角度讲述统计机器学习的相关理论,没记错的话应该是没有什么代码,帮助理解算法的原理。

周志华:机器学习 这本书是我觉得中文书里讲机器学习最好的。人称”西瓜书“,如果要了解深度学习,可能需要“花书”。 本书讲述了常见的机器学习算法,以及对应的原理,并且运用巧妙比喻的同时还解答了一些常见的疑问。对我来说,比《机器学习实战》这本书更能贴近原理,同时又不缺乏实战。两者兼顾,不可多得。

美团机器学习实战 这本书是美团出的,很好的一本书,把很多实际业务中使用到的算法展示了出来。虽然和安全无关。但是可以了解一些思路,店铺图像识别,评价分类。对我而言,主要就是扩充视野。

python和自然语言处理 这本书上来就是干,不会很深入,但是你都可以理解并去应用。同时,具有丰富的代码和案例,自己实验一遍,对自然语言处理以及相关工具的使用都会有一个很大的进步,后来为了深入了解原理买了下面这本书。

统计自然语言处理 没有看完。。。就看了一点。不过这本也是公认的好书。不过要想系统的,深入的学自然语言不看这本书是不可能的。

pattern recongnition and machine learning 前面两本都是自然语言处理的,模式识别类的要看这一本。而且这本也是经典书籍。不过当时为了锻炼英语打印的是英文版,结果又是一本没有看完的书。。但我还是推荐给大家。

Hands-On ML wiitgh sklearn & tensorflow 这本算是工具书,sklearn, tf, keras, pytorch等等工具其实都是要学习的,最好的方式是看官方文档。而不是看书,不过为什么推荐这本书呢,代码详细,而且还有一些比较详细的解释。记得我对boost的实际代码运用就是从这本书里学到的。

ml dl 0.0.1 这个图是我自己搞得,为什么有这个图呢?因为大部分学院派搞AI安全的根本没有多少安全经验,甚至连一些基础安全产品都没有用过。不过也不能怪学院派。同样工程派基本上就是干,可能有的对原理也不是很了解。总之,产品,数据,算法,安全这一坨我还没有见过都能懂的人。当然我也不可能都懂。国外还有一些数据分析和安全相关的书籍,可以参考一下。也可以去github上关注一些相关的项目。我身边倒是接触过不少搞这些东西的老铁。不过信念这个东西一定要持续下去才行。安全在数据方面的应用至少有30年的尝试了,只是最近才开始火爆起来。所以无论是先来还是后到,看看能不能长江后浪推前浪吧。 我对AI安全的信念是希望有一天能够真的AI安全。不是简单的检测,甚至不知道原理的检测。fuzzing也能更有效,大概如此吧。少年,等你接着去探索。 有这方面想法的可以进404 not found的群,cdxy,骑着蜗牛逛世界也都在里面。

后语

关注AI安全这一块的,肯定知道有几本I安全的书,为什么我没推荐呢,这一系列3本讲AI安全的。先不管作者怎么样,这本书质量确实是不咋样,堆叠实例,缺乏原理,瞎比喻。说白了就是糊弄。同时安全圈子出书的套路就是,东拼西凑一本书,各个大佬站台推荐。然后朋友圈各路转发,公众号推荐。买到手一看,这他妈是啥?著书立说乃是大事,最开始国内人出的编程类技术书我基本不看。还有什么一套套的“黄皮”书,尤其是有几本讲安全的黄皮书,垃圾。不过现在可能不像之前这么苛刻,觉得但凡开卷有益,也算作者写的有用。就是值不值这个价钱。还是那句话,著书立说乃是大事,不要乱出来误人子弟。写书骗人能算骗吗?读书人的事,怎么叫骗呢?