rapidsai
diff --git a/‎.flake8
+5 b/‎.flake8
+5
diff --git a/‎Makefile
+6-5 b/‎Makefile
+6-5
diff --git a/‎README.md
+20 b/‎README.md
+20
diff --git a/‎benchmarks/bibw-asyncio.py
+16-11 b/‎benchmarks/bibw-asyncio.py
+16-11
diff --git a/‎benchmarks/bibw-future.py
+16-11 b/‎benchmarks/bibw-future.py
+16-11
diff --git a/‎benchmarks/lat-asyncio-blind-recv.py
+16-11 b/‎benchmarks/lat-asyncio-blind-recv.py
+16-11
@@ -0,0 +1,5 @@
+[flake8]
+filename = *.pyx,*.px*
+exclude = .eggs,*.egg,build
+ignore = E901,E225,E226,E227,E999
+max-line-length = 88
@@ -1,17 +1,18 @@
 CC = gcc
 UCX_PATH  ?= "$(abspath $(shell pwd))/../ucx/install"
 CUDA_PATH ?= "/usr/local/cuda"
+PYTHON    ?= python3
 
 CFLAGS  = "-I$(UCX_PATH)/include -I$(CUDA_PATH)/include"
 LDFLAGS = "-L$(UCX_PATH)/lib -L$(CUDA_PATH)/lib64"
 
 install:
-	LDFLAGS=$(LDFLAGS) CFLAGS=$(CFLAGS) python3 setup.py build_ext -i --with-cuda
-	python3 -m pip install -e .
+	LDFLAGS=$(LDFLAGS) CFLAGS=$(CFLAGS) $(PYTHON) setup.py build_ext -i --with-cuda
+	$(PYTHON) -m pip install -e .
 
 install-cpu:
-	LDFLAGS=$(LDFLAGS) CFLAGS=$(CFLAGS) python3 setup.py build_ext -i
-	python3 -m pip install -e .
+	LDFLAGS=$(LDFLAGS) CFLAGS=$(CFLAGS) $(PYTHON) setup.py build_ext -i
+	$(PYTHON) -m pip install -e .
 
 conda-install:
 	LDFLAGS=$(LDFLAGS) CFLAGS=$(CFLAGS) $(PYTHON) setup.py build_ext -i --with-cuda install
@@ -27,7 +28,7 @@ clean:
 	rm -rf *.egg-info
 
 test:
-	python3 -m pytest tests
+	$(PYTHON) -m pytest tests
 
 conda-packages:
 	conda build --numpy=1.14 --python=3.7 ucx
 
@@ -78,3 +78,23 @@ These three libraries provide a powerful combination of HPC message passing tool
 You should be done! Test the result of your build with
 
     pytest -v
+
+### TCP Support
+
+In order to use TCP add `tcp` to `UCX_TLS` and set `UCXPY_IFNAME` to the network interface you want to use. Some setup examples:
+
+    # TCP using "eth0" and CUDA support
+    export UCX_TLS=tcp,sockcm,cuda_copy,cuda_ipc
+    export UCX_SOCKADDR_TLS_PRIORITY=sockcm
+    export UCXPY_IFNAME="eth0"
+
+    # InfiniBand using "ib0" and CUDA support
+    export UCX_TLS=sockcm,cuda_copy,cuda_ipc
+    export UCX_SOCKADDR_TLS_PRIORITY=sockcm
+    export UCXPY_IFNAME="ib0"
+
+    # TCP using "eno0" and no CUDA support
+    export UCX_TLS=tcp,sockcm
+    export UCX_SOCKADDR_TLS_PRIORITY=sockcm
+    export UCXPY_IFNAME="eno0"
+
@@ -16,6 +16,7 @@
 max_iters = 256
 window_size = 64
 
+
 async def talk_to_client(client_ep):
 
     global args
@@ -27,7 +28,7 @@ async def talk_to_client(client_ep):
     send_buffer_region = ucp.buffer_region()
     recv_buffer_region = ucp.buffer_region()
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.alloc_cuda(1 << msg_log)
         recv_buffer_region.alloc_cuda(1 << msg_log)
     else:
@@ -65,10 +66,10 @@ async def talk_to_client(client_ep):
         end = time.time()
         lat = end - start
         bw = (iters * window_size * msg_len * 2) / lat
-        bw = bw / 1e9 #GB/s
+        bw = bw / 1e9  # GB/s
         print("{}\t\t{}".format(msg_len, bw))
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.free_cuda()
         recv_buffer_region.free_cuda()
     else:
@@ -78,6 +79,7 @@ async def talk_to_client(client_ep):
     ucp.destroy_ep(client_ep)
     ucp.stop_server()
 
+
 async def talk_to_server(ip, port):
 
     global args
@@ -91,7 +93,7 @@ async def talk_to_server(ip, port):
     send_buffer_region = ucp.buffer_region()
     recv_buffer_region = ucp.buffer_region()
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.alloc_cuda(1 << msg_log)
         recv_buffer_region.alloc_cuda(1 << msg_log)
     else:
@@ -126,9 +128,9 @@ async def talk_to_server(ip, port):
             await asyncio.wait(pending_list)
         end = time.time()
         lat = end - start
-        lat = ((lat/2) / iters)* 1000000
+        lat = ((lat / 2) / iters) * 1000000
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.free_cuda()
         recv_buffer_region.free_cuda()
     else:
@@ -137,11 +139,14 @@ async def talk_to_server(ip, port):
 
     ucp.destroy_ep(server_ep)
 
+
 parser = argparse.ArgumentParser()
-parser.add_argument('-s','--server', help='enter server ip', required=False)
-parser.add_argument('-p','--port', help='enter server port number', required=False)
-parser.add_argument('-i','--intra_node', action='store_true')
-parser.add_argument('-m','--mem_type', help='host/cuda (default = host)', required=False)
+parser.add_argument("-s", "--server", help="enter server ip", required=False)
+parser.add_argument("-p", "--port", help="enter server port number", required=False)
+parser.add_argument("-i", "--intra_node", action="store_true")
+parser.add_argument(
+    "-m", "--mem_type", help="host/cuda (default = host)", required=False
+)
 args = parser.parse_args()
 
 ## initiate ucp
@@ -159,7 +164,7 @@ async def talk_to_server(ip, port):
 if server:
     if args.intra_node:
         ucp.set_cuda_dev(1)
-    coro = ucp.start_server(talk_to_client, is_coroutine = True)
+    coro = ucp.start_server(talk_to_client, is_coroutine=True)
 else:
     coro = talk_to_server(init_str.encode(), int(args.port))
 
 
@@ -12,6 +12,7 @@
 max_iters = 256
 window_size = 64
 
+
 def talk_to_client(client_ep):
 
     global args
@@ -24,7 +25,7 @@ def talk_to_client(client_ep):
     send_buffer_region = ucp.buffer_region()
     recv_buffer_region = ucp.buffer_region()
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.alloc_cuda(1 << msg_log)
         recv_buffer_region.alloc_cuda(1 << msg_log)
     else:
@@ -68,10 +69,10 @@ def talk_to_client(client_ep):
         end = time.time()
         lat = end - start
         bw = (iters * window_size * msg_len * 2) / lat
-        bw = bw / 1e9 #GB/s
+        bw = bw / 1e9  # GB/s
         print("{}\t\t{}".format(msg_len, bw))
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.free_cuda()
         recv_buffer_region.free_cuda()
     else:
@@ -82,6 +83,7 @@ def talk_to_client(client_ep):
     cb_not_done = False
     ucp.stop_server()
 
+
 def talk_to_server(ip, port):
 
     global args
@@ -95,7 +97,7 @@ def talk_to_server(ip, port):
     send_buffer_region = ucp.buffer_region()
     recv_buffer_region = ucp.buffer_region()
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.alloc_cuda(1 << msg_log)
         recv_buffer_region.alloc_cuda(1 << msg_log)
     else:
@@ -136,9 +138,9 @@ def talk_to_server(ip, port):
                         pending_list.remove(ft)
         end = time.time()
         lat = end - start
-        lat = ((lat/2) / iters)* 1000000
+        lat = ((lat / 2) / iters) * 1000000
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.free_cuda()
         recv_buffer_region.free_cuda()
     else:
@@ -147,11 +149,14 @@ def talk_to_server(ip, port):
 
     ucp.destroy_ep(server_ep)
 
+
 parser = argparse.ArgumentParser()
-parser.add_argument('-s','--server', help='enter server ip', required=False)
-parser.add_argument('-p','--port', help='enter server port number', required=False)
-parser.add_argument('-i','--intra_node', action='store_true')
-parser.add_argument('-m','--mem_type', help='host/cuda (default = host)', required=False)
+parser.add_argument("-s", "--server", help="enter server ip", required=False)
+parser.add_argument("-p", "--port", help="enter server port number", required=False)
+parser.add_argument("-i", "--intra_node", action="store_true")
+parser.add_argument(
+    "-m", "--mem_type", help="host/cuda (default = host)", required=False
+)
 args = parser.parse_args()
 
 ## initiate ucp
@@ -168,7 +173,7 @@ def talk_to_server(ip, port):
 if server:
     if args.intra_node:
         ucp.set_cuda_dev(1)
-    ucp.start_server(talk_to_client, is_coroutine = False)
+    ucp.start_server(talk_to_client, is_coroutine=False)
     while cb_not_done:
         ucp.progress()
 else:
 
@@ -12,6 +12,7 @@
 max_msg_log = 23
 max_iters = 1000
 
+
 async def talk_to_client(client_ep):
 
     global args
@@ -21,7 +22,7 @@ async def talk_to_client(client_ep):
 
     send_buffer_region = ucp.buffer_region()
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.alloc_cuda(1 << msg_log)
     else:
         send_buffer_region.alloc_host(1 << msg_log)
@@ -46,17 +47,18 @@ async def talk_to_client(client_ep):
             await recv_req
         end = time.time()
         lat = end - start
-        lat = ((lat/2) / iters)* 1000000
+        lat = ((lat / 2) / iters) * 1000000
         print("{}\t\t{}".format(msg_len, lat))
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.free_cuda()
     else:
         send_buffer_region.free_host()
 
     ucp.destroy_ep(client_ep)
     ucp.stop_server()
 
+
 async def talk_to_server(ip, port):
 
     global args
@@ -68,7 +70,7 @@ async def talk_to_server(ip, port):
 
     send_buffer_region = ucp.buffer_region()
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.alloc_cuda(1 << msg_log)
     else:
         send_buffer_region.alloc_host(1 << msg_log)
@@ -91,20 +93,23 @@ async def talk_to_server(ip, port):
             send_req = await server_ep.send(send_msg, msg_len)
         end = time.time()
         lat = end - start
-        lat = ((lat/2) / iters)* 1000000
+        lat = ((lat / 2) / iters) * 1000000
 
-    if args.mem_type == 'cuda':
+    if args.mem_type == "cuda":
         send_buffer_region.free_cuda()
     else:
         send_buffer_region.free_host()
 
     ucp.destroy_ep(server_ep)
 
+
 parser = argparse.ArgumentParser()
-parser.add_argument('-s','--server', help='enter server ip', required=False)
-parser.add_argument('-p','--port', help='enter server port number', required=False)
-parser.add_argument('-i','--intra_node', action='store_true')
-parser.add_argument('-m','--mem_type', help='host/cuda (default = host)', required=False)
+parser.add_argument("-s", "--server", help="enter server ip", required=False)
+parser.add_argument("-p", "--port", help="enter server port number", required=False)
+parser.add_argument("-i", "--intra_node", action="store_true")
+parser.add_argument(
+    "-m", "--mem_type", help="host/cuda (default = host)", required=False
+)
 args = parser.parse_args()
 
 ## initiate ucp
@@ -122,7 +127,7 @@ async def talk_to_server(ip, port):
 if server:
     if args.intra_node:
         ucp.set_cuda_dev(1)
-    coro = ucp.start_server(talk_to_client, is_coroutine = True)
+    coro = ucp.start_server(talk_to_client, is_coroutine=True)
 else:
     coro = talk_to_server(init_str.encode(), int(args.port))