Сканер секретів та небезпечних паттернів у коді та конфігураціях
Loading...
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Державний університет «Київський авіаційний інститут»
Abstract
Об’єкт дослідження – процеси забезпечення інформаційної безпеки на етапі розробки ПЗ, зокрема витоки секретів у вихідному коді та конфігураційних файлах.
Мета кваліфікаційної роботи – розробка та апробація прототипу інструмента для автоматизованого виявлення секретів і очевидних небезпечних патернів у файлах проекту.
Методи дослідження – правило-орієнтований аналіз (regex), ентропійний аналіз (Shannon), контекстний аналіз, модульне проєктування, прототипування на Python, формування тестових наборів і вимірювання метрик (TP/FP/FN, Precision, Recall, F1). Результати роботи містять реалізований прототип сканера з модульною архітектурою, набір початкових правил у форматі YAML/JSON, механізм маскування і формування JSON-звітів, а також експериментальні показники (приблизно Precision ≈ 79.3%, Recall ≈ 85.7%, F1 ≈ 82.4%) і рекомендації щодо зниження хибних спрацьовувань та інтеграції в CI.
Розробка та тестування проводилися у середовищі Visual Studio Code на Python 3.8+ під ОС Windows.
The object of research is the processes of ensuring information security during software development, in particular the leakage of secrets in source code and configuration files. The aim of the thesis is to develop and validate a prototype tool for automated detection of secrets and obvious dangerous patterns in project files. Research methods include rule-based analysis using regular expressions, entropy-based analysis (Shannon entropy), contextual analysis, modular software design, prototyping in Python, creation of test datasets, and measurement of evaluation metrics (TP/FP/FN, Precision, Recall, F1). The results of the work include an implemented prototype scanner with a modular architecture, an initial set of detection rules in YAML/JSON format, mechanisms for masking sensitive data and generating JSON reports, as well as experimental evaluation results (approximately Precision ≈ 79.3%, Recall ≈ 85.7%, F1 ≈ 82.4%) and practical recommendations for reducing false positives and integrating the tool into CI pipelines. The development and testing were carried out under the Windows operating system. The software was developed in the Visual Studio Code environment using the Python programming language.
The object of research is the processes of ensuring information security during software development, in particular the leakage of secrets in source code and configuration files. The aim of the thesis is to develop and validate a prototype tool for automated detection of secrets and obvious dangerous patterns in project files. Research methods include rule-based analysis using regular expressions, entropy-based analysis (Shannon entropy), contextual analysis, modular software design, prototyping in Python, creation of test datasets, and measurement of evaluation metrics (TP/FP/FN, Precision, Recall, F1). The results of the work include an implemented prototype scanner with a modular architecture, an initial set of detection rules in YAML/JSON format, mechanisms for masking sensitive data and generating JSON reports, as well as experimental evaluation results (approximately Precision ≈ 79.3%, Recall ≈ 85.7%, F1 ≈ 82.4%) and practical recommendations for reducing false positives and integrating the tool into CI pipelines. The development and testing were carried out under the Windows operating system. The software was developed in the Visual Studio Code environment using the Python programming language.
Description
Робота публікується згідно наказу ректора Університету від 27.05.2021 р. №311/од «Про розміщення кваліфікаційних робіт здобувачів вищої освіти в репозиторії університету». Науковий керівник: Гріненко Олена Олександрівна
Keywords
сканер секретів, виявлення секретів, небезпечні патерни, regex, ентропія, python, vscode, json., secret scanner, secret detection, dangerous patterns, regex, entropy, python, source code analysis, configuration files., кваліфікаційна робота
Citation
Рябчук О. Сканер секретів та небезпечних паттернів у коді та конфігураціях . - Кваліфікаційна робота на здобуття освітнього ступеня магістр. – Київ, КАІ, 2025. - 67 с.