Skip to content

mti-lab/202503_t_takeda

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CCIR: Chat-based Composed Image Retrieval

環境構築

ライブラリをimportする

pip install -r requirements.txt

.envファイルを作成し、OPENAI_API_KEYを記入する

データのダウンロード

実験に使用する際のデータセットを以下のサイトからそれぞれダウンロードし、データディレクトリの.gitkeepがある箇所にダウンロードする Visual Dialog(Validation set), COCO (COCO2017 Val images), Flickr30k

実験順序

データベースの画像のキャプションを作成する

make_caption_from_blip2.py

キャプションを特徴量に変換する

make_text_features.py

画像データベースを特徴量に変換する

prepare_corpus_blip.py or prepare_corpus_clip.py

そしてCCIRディレクトリの以下のファイルを実行する

python eval.py

先行研究との比較

先行研究との比較は以下のリポジトリを参考にそれぞれコードを実行する

ChatIR, PlugIR, Pic2Word, MagicLens

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages