🎓 DaiNam University Plagiarism Detection System

🔬 Advanced Academic Integrity Through AI Innovation

A Next-Generation Plagiarism Detection System Powered by Deep Learning and Vector Search Technology

Architecture • Features • Tech Stack • Installation • Getting Started • Docs

🏗️ Architecture

The system employs a three-tier architecture:

📄 Document Processing Layer: Extracts text from PDFs, segments into sentences, and generates embeddings
💾 Storage Layer: Stores document metadata in PostgreSQL and vector embeddings in Milvus
🔎 Search Layer: Performs high-performance similarity searches and generates detailed reports

✨ Key Features

🧠 Advanced AI Technology

Semantic Analysis Engine: Powered by state-of-the-art transformer models
Multi-lingual Support: Optimized for Vietnamese and English content
Context-Aware Detection: Understanding beyond simple text matching

⚡ High-Performance Architecture

Vector Search Technology: Using Milvus for lightning-fast similarity search
Parallel Processing: Efficient handling of large document collections
Scalable Infrastructure: Designed for institutional deployment

📊 Comprehensive Analysis

Visual Results: Interactive visualization of matched content
Detailed Reports: Page-by-page similarity analysis
Evidence Mapping: Precise location of potential matches

🔧 Tech Stack

Core Technologies

Database Systems

📥 Installation

🛠️ Prerequisites

🐍 Python 3.8+ - Core programming language
🐘 PostgreSQL 12+ - Relational database for metadata
🔍 Milvus 2.x - Vector database for similarity search
🐳 Docker & Docker Compose - Container management
💾 RAM 8GB+ - Recommended for optimal performance
💻 CPU 4+ cores - For parallel processing
🖴 Storage 10GB+ - For document storage and embeddings

🗃️ Database Setup

🐘 PostgreSQL Setup

# Start PostgreSQL service
docker run -d \
  --name postgres \
  -e POSTGRES_USER=username \
  -e POSTGRES_PASSWORD=password \
  -e POSTGRES_DB=database_name \
  -p 5434:5432 \
  postgres:12

🔍 Milvus Setup

# Download Milvus docker-compose file
wget https://github.com/milvus-io/milvus/releases/download/v2.3.3/milvus-standalone-docker-compose.yml -O docker-compose.yml

# Start Milvus
docker-compose up -d

⚙️ Project Setup

📦 Clone Repository

git clone https://github.com/drkhanusa/DNU_PlagiarismChecker.git
cd DNU_PlagiarismChecker

🌟 Create Virtual Environment

python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

📚 Install Dependencies
```
pip install -e .
```

⚡ Environment Configuration

# Copy example environment file
cp .env.example .env

# Edit .env with your settings
# Example configuration:
DATABASE_URL=postgresql://username:password@localhost:5434/database_name
MILVUS_HOST=localhost
MILVUS_PORT=19530

🔄 Initialize Database

# Create database tables
python setup_database.py

# Initialize Milvus collection
python create_milvus_db.py

🚀 Getting Started

⚡ Quick Start

from plagiarism_checker import check_plagiarism_details

# Check a document
results = check_plagiarism_details(
    file_path="path/to/document.pdf",
    min_similarity=0.9
)

# View results
print(f"Overall Similarity: {results['data']['total_percent']}%")
for doc in results['data']['similarity_documents']:
    print(f"Match: {doc['name']} - {doc['similarity_value']}%")

📥 Adding Documents to Database

from create_corpus import CorpusCreator

creator = CorpusCreator()
creator.process_document("path/to/document.pdf")

📚 Documentation

For detailed documentation, please visit our Wiki or refer to the following sections:

📝 License

Made with 💻 by AIoTLab at DaiNam University

Website • GitHub • Contact Us

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
attu		attu
aws_file		aws_file
config		config
docs/images		docs/images
embedding_models		embedding_models
milvus_db		milvus_db
models		models
paper		paper
routers		routers
test		test
.gitignore		.gitignore
README.md		README.md
abcd.json		abcd.json
main.py		main.py
received_zipfile.py		received_zipfile.py
requirements.txt		requirements.txt
setup.py		setup.py
zip_test.py		zip_test.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🎓 DaiNam University Plagiarism Detection System

🔬 Advanced Academic Integrity Through AI Innovation

🏗️ Architecture

✨ Key Features

🧠 Advanced AI Technology

⚡ High-Performance Architecture

📊 Comprehensive Analysis

🔧 Tech Stack

Core Technologies

Database Systems

📥 Installation

🛠️ Prerequisites

🗃️ Database Setup

⚙️ Project Setup

🚀 Getting Started

⚡ Quick Start

📥 Adding Documents to Database

📚 Documentation

📝 License

Made with 💻 by AIoTLab at DaiNam University

About

Releases

Packages

Languages

drkhanusa/DNU_PlagiarismChecker

Folders and files

Latest commit

History

Repository files navigation

🎓 DaiNam University Plagiarism Detection System

🔬 Advanced Academic Integrity Through AI Innovation

🏗️ Architecture

✨ Key Features

🧠 Advanced AI Technology

⚡ High-Performance Architecture

📊 Comprehensive Analysis

🔧 Tech Stack

Core Technologies

Database Systems

📥 Installation

🛠️ Prerequisites

🗃️ Database Setup

⚙️ Project Setup

🚀 Getting Started

⚡ Quick Start

📥 Adding Documents to Database

📚 Documentation

📝 License

Made with 💻 by AIoTLab at DaiNam University

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages