sample-for-video-similarity-using-serverless

【中文 | English】

sample-for-video-similarity-using-serverless

Project Background

Short video platforms are prevalent, producing a large number of videos daily. There exists an issue of creators misappropriating others' videos, necessitating technical means to identify similar videos.

Traditional identification methods typically rely on manual detection and simple applications, such as identifying video titles or descriptions. However, with the generation of massive data, such methods cannot efficiently process and comply with non-circular and non-personal requirements. To address these issues, this project was launched to implement automatic video similarity detection through an efficient unified identification model.

Implementation Principles

Video Similarity Comparison

Video Frame Extraction: Use OpenCV for uniform frame extraction from videos
Feature Extraction: Utilize pre-trained ResNet50 model to convert each frame into a 1000-dimensional feature vector
Vector Matrix Calculation: Form matrices from feature vectors of all frames
Similarity Calculation: Calculate similarity scores between two videos using algorithms like cosine similarity

Project Architecture

Operation Guide

1. Subscribe and Deploy ResNet50 on AWS Marketplace

Subscription link: ResNet50 Subscription

After deployment, remember the SageMaker Endpoint Name;

2. CDK One-Click Deployment

Install AWS CDK: Please refer to CDK Installation Guide
Clone project locally and deploy using CDK:

cd src/cdk
# Example: Specify SageMaker endpoint
cdk deploy --parameters sagemaker_endpoint=ResNet50

Get API Gateway Endpoint;
Create OpenSearch index:

curl --location 'https://{{apigateway.endpoint.url}}/create_opensearch_index' \
--header 'Content-Type: text/plain' \
--data '{}'

API Documentation

Get Video Vector

Path: /get_video_vector
Method: POST
Request Params:

{
    "video_url": "s3://your_bucket/test.mp4"
}

Response:

{
    "video_vectors": {
        "image_001": [0.2212321, 0.2212321...],
        "image_002": [0.2212321, 0.2212321...],
        ...
    }
}

Insert Video Vector into Vector Database

Path: /insert_video_vector
Method: POST
Request Params:

{
    "video_url": "s3://your_bucket/test.mp4"
}

Response:

{"result": 136}

Search Similar Videos

Path: /search_similarity_videos
Method: GET
Request Params:

{
    "video_url": "s3://your_bucket/test.mp4",
    "size": 10
}

Response:

{
    "videos": [
        {
            "video_url": "s3://your_bucket/test.mp4",
            "score": 0.99
        },
        {
            "video_url": "s3://your_bucket/test.mp4",
            "score": 0.99
        },
        ...
    ]
}

Compare Two Videos Similarity

Path: /video_similarity
Method: POST
Request Params:

{
    "video_url_1": "s3://your_bucket/test.mp4",
    "video_url_2": "s3://your_bucket/test.mp4"
}

Response:

{
    "score": 0.92
}

FAQ

Why choose ResNet50 model? ResNet50 is a well-proven balanced model with excellent image classification and feature extraction capabilities, suitable for video vectorization tasks.
Does OpenSearch support encrypted search? Yes, it supports data security through encrypted channels (HTTPS) and access control features.
How to maintain video original files and vector data? Recommend using Amazon S3 for video storage and Lambda for real-time invocation and vector addition.

Contribution Guidelines

See CONTRIBUTING for more information.

Security

See CONTRIBUTING for more information.

License

This library is licensed under the MIT-0 License. See the LICENSE file.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
assets		assets
src		src
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README-CN.md		README-CN.md
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

sample-for-video-similarity-using-serverless

Project Background

Implementation Principles

Video Similarity Comparison

Similar Video Retrieval

Project Architecture

Operation Guide

1. Subscribe and Deploy ResNet50 on AWS Marketplace

2. CDK One-Click Deployment

API Documentation

Get Video Vector

Insert Video Vector into Vector Database

Search Similar Videos

Compare Two Videos Similarity

FAQ

Contribution Guidelines

Security

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 3

Uh oh!

Languages

License

aws-samples/sample-for-video-similarity-using-serverless

Folders and files

Latest commit

History

Repository files navigation

sample-for-video-similarity-using-serverless

Project Background

Implementation Principles

Video Similarity Comparison

Similar Video Retrieval

Project Architecture

Operation Guide

1. Subscribe and Deploy ResNet50 on AWS Marketplace

2. CDK One-Click Deployment

API Documentation

Get Video Vector

Insert Video Vector into Vector Database

Search Similar Videos

Compare Two Videos Similarity

FAQ

Contribution Guidelines

Security

License

About

Topics

Resources

License

Code of conduct

Security policy

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 3

Uh oh!

Languages

Packages