Datamule

A Python package for working with SEC filings at scale. Full Documentation | Website

Related packages:

Features

Quick Start

Basic Installation

pip install datamule

Basic Usage

from datamule import Portfolio

# Create a Portfolio object
portfolio = Portfolio('output_dir') # can be an existing directory or a new one

# Download submissions
portfolio.download_submissions(
   filing_date=('2023-01-01','2023-01-03'),
   submission_type=['10-K']
)

# Iterate through documents by document type
for ten_k in portfolio.document_type('10-K'):
   ten_k.parse()
   print(ten_k.data['document']['part2']['item7'])

# Iterate through documents by what strings they contain
for document in portfolio.contains_string('United States'):
   print(document.path)

# You can also use regex patterns
for document in portfolio.contains_string(r'(?i)covid-19'):
   print(document.type)

# For faster operations, you can take advantage of built in threading with callback function
def callback(submission):
   print(submission.path)

submission_results = portfolio.process_submissions(callback)

Examples

Create a discord bot, use insider trading disclosures to map relationships in Silicon Valley, and more in examples.

Data Provider

Default is the SEC, but for faster downloads you can use datamule.

from datamule import Config

config = Config()
config.set_default_source("datamule") # set default source to datamule, can also be "sec"
print(f"Default source: {config.get_default_source()}")

To use datamule as a provider, you need an API key. It costs $1/100,000 downloads.

Benchmarks

File Size	Examples	Downloader	Premium Downloader
Small Files	3, 4, 5	5/s	300/s
Medium Files	8-K	5/s	60/s
Large Files	10-K	3/s	5/s

Articles

License

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 344 Commits
.github/workflows		.github/workflows
archive		archive
datamule		datamule
examples		examples
.gitignore		.gitignore
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
contributors.md		contributors.md
readme.rst		readme.rst

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Datamule

Related packages:

Features

Quick Start

Basic Installation

Basic Usage

Examples

Data Provider

Articles

License

About

Releases

Packages

Contributors 3

Languages

License

john-friedman/datamule-python

Folders and files

Latest commit

History

Repository files navigation

Datamule

Related packages:

Features

Quick Start

Basic Installation

Basic Usage

Examples

Data Provider

Articles

License

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages