Malware Classification Using BEiT

Overview

This project leverages the BEiT (Bidirectional Encoder representation from Image Transformers) model for classifying malware images. By utilizing advanced deep learning techniques, the framework processes and identifies patterns in malware images for accurate classification.

Features

BEiT Integration: Uses a pre-trained BEiT model for robust image feature extraction and classification.
Efficient Training Pipeline: Employs PyTorch Lightning for streamlined training.
Custom Dataset Handling: Supports custom datasets with preprocessing and augmentation.
Visualization: Generates detailed visualizations for model performance.

Technologies Used

Programming Language: Python
Frameworks and Libraries:
- PyTorch: Deep learning framework.
- PyTorch Lightning: Training abstraction for PyTorch.
- Transformers: BEiT model implementation.
- Pandas: Data manipulation and preprocessing.
- NumPy: Numerical operations.
- Matplotlib and Seaborn: Visualization libraries.

Dataset Preprocessing

The dataset should include labeled malware images.
Preprocessing steps include resizing, normalizing, and augmenting the images.
The framework splits the dataset into training, validation, and testing sets using stratified sampling.

Model Training

The BEiT model is fine-tuned on the preprocessed dataset.
Training includes gradient computation, backpropagation, and optimizer updates.
The framework logs training metrics, including loss and accuracy.

Testing

The trained model is evaluated on the test set.
A custom function generates classification reports, including precision, recall, and F1-score.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
BEiT_model.ipynb		BEiT_model.ipynb
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Malware Classification Using BEiT

Overview

Features

Technologies Used

Dataset Preprocessing

Model Training

Testing

About

Releases

Packages

Languages

shaheen234/Malware_Classification

Folders and files

Latest commit

History

Repository files navigation

Malware Classification Using BEiT

Overview

Features

Technologies Used

Dataset Preprocessing

Model Training

Testing

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages