1、数据集简介 实验采用公开的HTTP CSIC2010数据集(http://www.isi.csic.es/dataset/),该数据集包含上万条自动生成的Web请求,主要用于测试网络攻击防护系统,它是由西班牙研究委员会(CSIC)信息安全研究所制作的。 当前,网络攻击检测面临的主要问题是缺乏公开可用的数据集来测试Web应用防火墙(WAFs)。DARPA数据集[1,2...
函数build_word_idx_for_sentence的功能是给定一个句子、向量长度和词典索引,先对句子进行分词,在根据词获取词在词典中的索引,将索引拼起来得到句子的词索引向量,以表示一句话。 函数read_dataset_from_file的功能是从正负样本(句子)文件中读取数据,并根据函数build_word_idx_for_sentence为每个样本(句子)生成词索引...
I stumbled over this set here: http://www.isi.csic.es/dataset/ It seems to be a standard data set used in the scientific community to measure the effectiveness of a WAF. Payloads are tagged as benign and malicious. [EDIT: Backup link: ht...
异常请求样本中包含 SQL 注入、文件遍历、CRLF 注入、XSS、SSI 等攻击样本。 数据集下载链接:http://www.isi.csic.es/dataset/ HTTP CSIC 2010 数据集单个样本为如下格式: image 根据观察,该数据集除路径(URI)和参数外其他 Header 无任何攻击 Payload,具有很多冗余信息。因此对该数据集进行格式化,只保留 HTTP 方...
CSIC2010网络攻击数据分词处理 CSIC2010数据集(http://www.isi.csic.es/dataset/)包含上万条自动生成的Web请求,主要用于测试网络攻击防护系统,它是由西班牙研究委员会(CSIC)信息安全研究所制作的。 CSIC2010包含针对电子商务Web应用产生的HTTP数据流量。在该Web应用中,用户可以通过购物车购买物品,并通过提供一些个人...
Input DATASETS csic-2010-web-application-attacks fwaf-dataset Language Python Table of Contents Comparing binary classification model over CSIC 2010 and FWAF datasets License This Notebook has been released under the Apache 2.0 open source license. Continue exploring Input2 files arrow_right_alt Outpu...
About Dataset Context The original .txt files are at http://www.isi.csic.es/dataset/ , I did my best to produce a .csv from them, still need some work. I kept all the fields intact, even though some are irrelevant for analysis. Usability info 6.47 License Data files © Original ...