quarkiverse
diff --git a/‎integration-tests/gpu-llama3/pom.xml‎
Lines changed: 104 additions & 0 deletions b/‎integration-tests/gpu-llama3/pom.xml‎
Lines changed: 104 additions & 0 deletions
diff --git a/‎integration-tests/gpu-llama3/src/main/java/org/acme/example/gpullama3/chat/ChatLanguageModelResource.java‎
Lines changed: 22 additions & 0 deletions b/‎integration-tests/gpu-llama3/src/main/java/org/acme/example/gpullama3/chat/ChatLanguageModelResource.java‎
Lines changed: 22 additions & 0 deletions
diff --git a/‎integration-tests/gpu-llama3/src/main/resources/application.properties‎
Lines changed: 5 additions & 0 deletions b/‎integration-tests/gpu-llama3/src/main/resources/application.properties‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎integration-tests/pom.xml‎
Lines changed: 11 additions & 0 deletions b/‎integration-tests/pom.xml‎
Lines changed: 11 additions & 0 deletions
diff --git a/‎model-providers/gpu-llama3/README.md‎
Lines changed: 51 additions & 0 deletions b/‎model-providers/gpu-llama3/README.md‎
Lines changed: 51 additions & 0 deletions
diff --git a/‎model-providers/gpu-llama3/deployment/pom.xml‎
Lines changed: 62 additions & 0 deletions b/‎model-providers/gpu-llama3/deployment/pom.xml‎
Lines changed: 62 additions & 0 deletions
diff --git a/‎model-providers/gpu-llama3/deployment/src/main/java/io/quarkiverse/langchain4j/gpullama3/deployment/ChatModelBuildConfig.java‎
Lines changed: 16 additions & 0 deletions b/‎model-providers/gpu-llama3/deployment/src/main/java/io/quarkiverse/langchain4j/gpullama3/deployment/ChatModelBuildConfig.java‎
Lines changed: 16 additions & 0 deletions
diff --git a/‎model-providers/gpu-llama3/deployment/src/main/java/io/quarkiverse/langchain4j/gpullama3/deployment/GPULlama3Processor.java‎
Lines changed: 58 additions & 0 deletions b/‎model-providers/gpu-llama3/deployment/src/main/java/io/quarkiverse/langchain4j/gpullama3/deployment/GPULlama3Processor.java‎
Lines changed: 58 additions & 0 deletions
diff --git a/‎model-providers/gpu-llama3/deployment/src/main/java/io/quarkiverse/langchain4j/gpullama3/deployment/LangChain4jGPULlama3BuildTimeConfig.java‎
Lines changed: 16 additions & 0 deletions b/‎model-providers/gpu-llama3/deployment/src/main/java/io/quarkiverse/langchain4j/gpullama3/deployment/LangChain4jGPULlama3BuildTimeConfig.java‎
Lines changed: 16 additions & 0 deletions
@@ -0,0 +1,104 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
+         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 https://maven.apache.org/xsd/maven-4.0.0.xsd">
+    <modelVersion>4.0.0</modelVersion>
+    <parent>
+        <groupId>io.quarkiverse.langchain4j</groupId>
+        <artifactId>quarkus-langchain4j-integration-tests-parent</artifactId>
+        <version>999-SNAPSHOT</version>
+    </parent>
+    <artifactId>quarkus-langchain4j-integration-test-gpu-llama3</artifactId>
+    <name>Quarkus LangChain4j - Integration Tests - GPULlama3</name>
+    <properties>
+        <skipITs>true</skipITs>
+        <maven.compiler.release>21</maven.compiler.release>
+        <quarkus.version>3.18.0</quarkus.version>
+        <!-- TornadoVM argfile path -->
+        <tornado.argfile>${env.TORNADO_SDK}/../../../tornado-argfile</tornado.argfile>
+    </properties>
+    <dependencies>
+        <dependency>
+            <groupId>io.quarkus</groupId>
+            <artifactId>quarkus-rest-jackson</artifactId>
+        </dependency>
+        <dependency>
+            <groupId>io.quarkiverse.langchain4j</groupId>
+            <artifactId>quarkus-langchain4j-gpu-llama3</artifactId>
+            <version>999-SNAPSHOT</version>
+        </dependency>
+        <dependency>
+            <groupId>io.quarkus</groupId>
+            <artifactId>quarkus-junit5</artifactId>
+            <scope>test</scope>
+        </dependency>
+        <dependency>
+            <groupId>io.rest-assured</groupId>
+            <artifactId>rest-assured</artifactId>
+            <scope>test</scope>
+        </dependency>
+        <dependency>
+            <groupId>org.assertj</groupId>
+            <artifactId>assertj-core</artifactId>
+            <scope>test</scope>
+        </dependency>
+        <dependency>
+            <groupId>io.quarkus</groupId>
+            <artifactId>quarkus-devtools-testing</artifactId>
+            <scope>test</scope>
+        </dependency>
+
+        <!-- Make sure the deployment artifact is built before executing this module -->
+        <dependency>
+            <groupId>io.quarkiverse.langchain4j</groupId>
+            <artifactId>quarkus-langchain4j-gpu-llama3-deployment</artifactId>
+            <version>999-SNAPSHOT</version>
+            <type>pom</type>
+            <scope>test</scope>
+            <exclusions>
+                <exclusion>
+                    <groupId>*</groupId>
+                    <artifactId>*</artifactId>
+                </exclusion>
+            </exclusions>
+        </dependency>
+    </dependencies>
+    <build>
+        <plugins>
+            <plugin>
+                <groupId>io.quarkus</groupId>
+                <artifactId>quarkus-maven-plugin</artifactId>
+                <executions>
+                    <execution>
+                        <goals>
+                            <goal>build</goal>
+                        </goals>
+                    </execution>
+                </executions>
+                <configuration>
+                    <!-- Pass tornado-argfile to dev mode -->
+                    <jvmArgs>@${tornado.argfile}</jvmArgs>
+                </configuration>
+            </plugin>
+
+            <plugin>
+                <artifactId>maven-failsafe-plugin</artifactId>
+                <executions>
+                    <execution>
+                        <goals>
+                            <goal>integration-test</goal>
+                            <goal>verify</goal>
+                        </goals>
+                        <configuration>
+                            <argLine>@${tornado.argfile}</argLine>
+                            <systemPropertyVariables>
+                                <native.image.path>${project.build.directory}/${project.build.finalName}-runner</native.image.path>
+                                <java.util.logging.manager>org.jboss.logmanager.LogManager</java.util.logging.manager>
+                                <maven.home>${maven.home}</maven.home>
+                            </systemPropertyVariables>
+                        </configuration>
+                    </execution>
+                </executions>
+            </plugin>
+        </plugins>
+    </build>
+</project>
@@ -0,0 +1,22 @@
+package org.acme.example.gpullama3.chat;
+
+import jakarta.ws.rs.GET;
+import jakarta.ws.rs.Path;
+
+import dev.langchain4j.model.chat.ChatModel;
+
+@Path("chat")
+public class ChatLanguageModelResource {
+
+    private final ChatModel chatModel;
+
+    public ChatLanguageModelResource(ChatModel chatModel) {
+        this.chatModel = chatModel;
+    }
+
+    @GET
+    @Path("blocking")
+    public String blocking() {
+        return chatModel.chat("When was the nobel prize for economics first awarded?");
+    }
+}
@@ -0,0 +1,5 @@
+# Configure GPULlama3
+quarkus.langchain4j.gpu-llama3.chat-model.model-path=/Users/orion/LLMModels/beehive-llama-3.2-1b-instruct-fp16.gguf
+quarkus.langchain4j.gpu-llama3.enable-integration=true
+quarkus.langchain4j.gpu-llama3.chat-model.temperature=0.7
+quarkus.langchain4j.gpu-llama3.chat-model.max-tokens=100
@@ -45,6 +45,7 @@
       </activation>
       <modules>
         <module>jlama</module>
+        <module>gpu-llama3</module>
       </modules>
     </profile>
     <profile>
@@ -107,6 +108,11 @@
                         <artifactId>quarkus-langchain4j-easy-rag</artifactId>
                         <version>999-SNAPSHOT</version>
                     </dependency>
+                    <dependency>
+                        <groupId>io.quarkiverse.langchain4j</groupId>
+                        <artifactId>quarkus-langchain4j-gpullama3</artifactId>
+                        <version>${quarkus-langchain4j.version}</version>
+                    </dependency>
                     <dependency>
                         <groupId>io.quarkiverse.langchain4j</groupId>
                         <artifactId>quarkus-langchain4j-hugging-face</artifactId>
@@ -122,6 +128,11 @@
                         <artifactId>quarkus-langchain4j-llama3-java</artifactId>
                         <version>999-SNAPSHOT</version>
                     </dependency>
+                  <dependency>
+                    <groupId>io.quarkiverse.langchain4j</groupId>
+                    <artifactId>quarkus-langchain4j-gpu-llama3</artifactId>
+                    <version>999-SNAPSHOT</version>
+                  </dependency>
                     <dependency>
                         <groupId>io.quarkiverse.langchain4j</groupId>
                         <artifactId>quarkus-langchain4j-mcp</artifactId>
 
@@ -0,0 +1,51 @@
+### How to run the integrated tests:
+
+#### 1) Install TornadoVM:
+
+```bash
+cd ~
+git clone [email protected]:beehive-lab/TornadoVM.git
+cd ~/TornadoVM
+./bin/tornadovm-installer --jdk jdk21 --backend opencl
+source setvars.sh
+```
+
+Note that the above steps:
+- Set `TORNADOVM_SDK` environment variable to the path of the TornadoVM SDK.
+- Create the `tornado-argfile` under `~/TornadoVM` which contains all the required JVM arguments to enable TornadoVM.
+- The argfile is automatically used in Quarkus dev mode; however, in production mode, you need to manually pass the argfile to the JVM (see step 3).
+
+#### 2) Build Quarkus-langchain4j:
+
+```bash
+cd ~
+git clone [email protected]:mikepapadim/quarkus-langchain4j.git
+cd ~/quarkus-langchain4j
+git checkout gpu-llama3-integration
+mvn clean install -DskipTests
+```
+
+#### 3) Run the integrated tests:
+
+##### 3.1 Deploy the Quarkus app:
+
+```bash
+cd ~/quarkus-langchain4j/integration-tests/gpullama3
+```
+- For *dev* mode, run:
+```
+mvn quarkus:dev
+```
+
+- For *production* mode, run:
+```bash
+java @~/TornadoVM/tornado-argfile -jar target/quarkus-app/quarkus-run.jar
+```
+##### 3.2 Send requests to the Quarkus app:
+
+when quarkus is running, open a new terminal and run:
+
+```bash
+curl http://localhost:8080/chat/blocking
+```
+
@@ -0,0 +1,62 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<project xmlns="http://maven.apache.org/POM/4.0.0"
+         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
+         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
+    <modelVersion>4.0.0</modelVersion>
+
+    <parent>
+        <groupId>io.quarkiverse.langchain4j</groupId>
+        <artifactId>quarkus-langchain4j-gpu-llama3-parent</artifactId>
+        <version>999-SNAPSHOT</version>
+    </parent>
+
+    <artifactId>quarkus-langchain4j-gpu-llama3-deployment</artifactId>
+    <name>Quarkus LangChain4j - GPULlama3 - Deployment</name>
+
+    <dependencies>
+        <dependency>
+            <groupId>io.quarkiverse.langchain4j</groupId>
+            <artifactId>quarkus-langchain4j-gpu-llama3</artifactId>
+            <version>${project.version}</version>
+        </dependency>
+
+        <!-- what is this -->
+        <dependency>
+            <groupId>io.quarkus</groupId>
+            <artifactId>quarkus-arc-deployment</artifactId>
+            <scope>provided</scope>
+        </dependency>
+        <dependency>
+            <groupId>io.quarkiverse.langchain4j</groupId>
+            <artifactId>quarkus-langchain4j-core-deployment</artifactId>
+            <version>${project.version}</version>
+        </dependency>
+
+        <dependency>
+            <groupId>io.quarkus</groupId>
+            <artifactId>quarkus-junit5-internal</artifactId>
+            <scope>test</scope>
+        </dependency>
+        <dependency>
+            <groupId>org.assertj</groupId>
+            <artifactId>assertj-core</artifactId>
+            <scope>test</scope>
+        </dependency>
+    </dependencies>
+
+    <build>
+        <plugins>
+            <plugin>
+                <artifactId>maven-compiler-plugin</artifactId>
+                <configuration>
+                    <annotationProcessorPaths>
+                        <path>
+                            <groupId>io.quarkus</groupId>
+                            <artifactId>quarkus-extension-processor</artifactId>
+                        </path>
+                    </annotationProcessorPaths>
+                </configuration>
+            </plugin>
+        </plugins>
+    </build>
+</project>
@@ -0,0 +1,16 @@
+package io.quarkiverse.langchain4j.gpullama3.deployment;
+
+import java.util.Optional;
+
+import io.quarkus.runtime.annotations.ConfigDocDefault;
+import io.quarkus.runtime.annotations.ConfigGroup;
+
+@ConfigGroup
+public interface ChatModelBuildConfig {
+
+    /**
+     * Whether the model should be enabled
+     */
+    @ConfigDocDefault("true")
+    Optional<Boolean> enabled();
+}
@@ -0,0 +1,58 @@
+package io.quarkiverse.langchain4j.gpullama3.deployment;
+
+import static io.quarkiverse.langchain4j.deployment.LangChain4jDotNames.CHAT_MODEL;
+
+import java.util.List;
+
+import jakarta.enterprise.context.ApplicationScoped;
+
+import io.quarkiverse.langchain4j.deployment.items.ChatModelProviderCandidateBuildItem;
+import io.quarkiverse.langchain4j.deployment.items.SelectedChatModelProviderBuildItem;
+import io.quarkiverse.langchain4j.gpullama3.runtime.GPULlama3Recorder;
+import io.quarkus.arc.deployment.SyntheticBeanBuildItem;
+import io.quarkus.deployment.annotations.BuildProducer;
+import io.quarkus.deployment.annotations.BuildStep;
+import io.quarkus.deployment.annotations.ExecutionTime;
+import io.quarkus.deployment.annotations.Record;
+import io.quarkus.deployment.builditem.FeatureBuildItem;
+
+public class GPULlama3Processor {
+
+    private static final String PROVIDER = "gpu-llama3";
+    private static final String FEATURE = "langchain4j-gpu-llama3";
+
+    @BuildStep
+    FeatureBuildItem feature() {
+        return new FeatureBuildItem(FEATURE);
+    }
+
+    @BuildStep
+    public void providerCandidates(BuildProducer<ChatModelProviderCandidateBuildItem> chatProducer,
+            LangChain4jGPULlama3BuildTimeConfig config) {
+        if (config.chatModel().enabled().isEmpty() || config.chatModel().enabled().get()) {
+            chatProducer.produce(new ChatModelProviderCandidateBuildItem(PROVIDER));
+        }
+    }
+
+    @BuildStep
+    @Record(ExecutionTime.RUNTIME_INIT)
+    void generateBeans(GPULlama3Recorder recorder,
+            List<SelectedChatModelProviderBuildItem> selectedChatModels,
+            BuildProducer<SyntheticBeanBuildItem> beanProducer) {
+
+        for (var selected : selectedChatModels) {
+            if (PROVIDER.equals(selected.getProvider())) {
+                String configName = selected.getConfigName();
+
+                var builder = SyntheticBeanBuildItem
+                        .configure(CHAT_MODEL)
+                        .setRuntimeInit()
+                        .defaultBean()
+                        .scope(ApplicationScoped.class)
+                        .supplier(recorder.chatModel(configName));
+
+                beanProducer.produce(builder.done());
+            }
+        }
+    }
+}
@@ -0,0 +1,16 @@
+package io.quarkiverse.langchain4j.gpullama3.deployment;
+
+import static io.quarkus.runtime.annotations.ConfigPhase.BUILD_TIME;
+
+import io.quarkus.runtime.annotations.ConfigRoot;
+import io.smallrye.config.ConfigMapping;
+
+@ConfigRoot(phase = BUILD_TIME)
+@ConfigMapping(prefix = "quarkus.langchain4j.gpu-llama3")
+public interface LangChain4jGPULlama3BuildTimeConfig {
+
+    /**
+     * Chat model related settings
+     */
+    ChatModelBuildConfig chatModel();
+}