SANSA-Stack
diff --git a/‎pom.xml‎
Lines changed: 17 additions & 3 deletions b/‎pom.xml‎
Lines changed: 17 additions & 3 deletions
diff --git a/‎sansa-inference-common/pom.xml‎
Lines changed: 4 additions & 4 deletions b/‎sansa-inference-common/pom.xml‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎…/spark/data/model/AbstractRDFGraph.scala‎ ‎…ck/inference/data/AbstractRDFGraph.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/model/AbstractRDFGraph.scala renamed to sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/AbstractRDFGraph.scala
Lines changed: 32 additions & 35 deletions b/‎…/spark/data/model/AbstractRDFGraph.scala‎ ‎…ck/inference/data/AbstractRDFGraph.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/model/AbstractRDFGraph.scala renamed to sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/AbstractRDFGraph.scala
Lines changed: 32 additions & 35 deletions
diff --git a/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/JenaOps.scala‎
Lines changed: 114 additions & 0 deletions b/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/JenaOps.scala‎
Lines changed: 114 additions & 0 deletions
diff --git a/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/JenaRDFTripleLike.scala‎
Lines changed: 14 additions & 0 deletions b/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/JenaRDFTripleLike.scala‎
Lines changed: 14 additions & 0 deletions
diff --git a/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/RDF.scala‎
Lines changed: 4 additions & 1 deletion b/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/RDF.scala‎
Lines changed: 4 additions & 1 deletion
diff --git a/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/RDFOps.scala‎
Lines changed: 33 additions & 0 deletions b/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/RDFOps.scala‎
Lines changed: 33 additions & 0 deletions
diff --git a/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/RDFVocab.scala‎
Lines changed: 15 additions & 0 deletions b/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/RDFVocab.scala‎
Lines changed: 15 additions & 0 deletions
@@ -3,7 +3,7 @@
   <modelVersion>4.0.0</modelVersion>
   <groupId>net.sansa-stack</groupId>
   <artifactId>sansa-inference-parent_2.11</artifactId>
-  <version>0.2.1-SNAPSHOT</version>
+  <version>0.2.1-jena-SNAPSHOT</version>
   <packaging>pom</packaging>
   <name>Inference API - Parent</name>
 
@@ -66,7 +66,7 @@
     <!--<java.version>>=1.8</java.version>-->
     <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
     <project.reporting.outputEncoding>UTF-8</project.reporting.outputEncoding>
-    <scala.version>2.11.8</scala.version>
+    <scala.version>2.11.11</scala.version>
     <scala.binary.version>2.11</scala.binary.version>
     <spark.version>2.2.0</spark.version>
     <flink.version>1.3.1</flink.version>
@@ -75,7 +75,7 @@
     <sansa.rdf.version>${sansa.stack.version}</sansa.rdf.version>
     <sansa.query.version>${sansa.stack.version}</sansa.query.version>
     <sansa.owl.version>${sansa.stack.version}</sansa.owl.version>
-    <jsa.subversion>1-1</jsa.subversion>
+    <jsa.subversion>1</jsa.subversion>
     <jsa.version>${jena.version}-${jsa.subversion}</jsa.version>
     <PermGen>64m</PermGen>
     <MaxPermGen>512m</MaxPermGen>
@@ -130,6 +130,12 @@
         <version>${scala.version}</version>
       </dependency>
 
+      <dependency>
+        <groupId>org.apache.hadoop</groupId>
+        <artifactId>hadoop-client</artifactId>
+        <version>2.7.2</version>
+      </dependency>
+
       <!-- Apache Spark Core -->
       <dependency>
         <groupId>org.apache.spark</groupId>
@@ -247,6 +253,14 @@
         <version>3.6.0</version>
       </dependency>
 
+      <!-- Config API -->
+      <dependency>
+        <groupId>com.typesafe</groupId>
+        <artifactId>config</artifactId>
+        <version>1.3.1</version>
+      </dependency>
+
+
 
     </dependencies>
   </dependencyManagement>
 
@@ -4,12 +4,12 @@
   <parent>
     <artifactId>sansa-inference-parent_2.11</artifactId>
     <groupId>net.sansa-stack</groupId>
-    <version>0.2.1-SNAPSHOT</version>
+    <version>0.2.1-jena-SNAPSHOT</version>
     <relativePath>../pom.xml</relativePath>
   </parent>
   <groupId>net.sansa-stack</groupId>
   <artifactId>sansa-inference-common_${scala.binary.version}</artifactId>
-  <version>0.2.1-SNAPSHOT</version>
+  <version>0.2.1-jena-SNAPSHOT</version>
   <name>Inference API - Common</name>
   <description>A set of common objects used in the Inference API</description>
 
@@ -31,12 +31,12 @@
     <dependency>
       <groupId>org.apache.jena</groupId>
       <artifactId>jena-tdb</artifactId>
-      <version>3.2.0</version>
+      <version>3.3.0</version>
     </dependency>
     <dependency>
       <groupId>org.apache.jena</groupId>
       <artifactId>jena-cmds</artifactId>
-      <version>3.2.0</version>
+      <version>3.3.0</version>
     </dependency>
 
     <!-- Graph API -->
 
@@ -1,10 +1,4 @@
-package net.sansa_stack.inference.spark.data.model
-
-import org.apache.jena.graph.Triple
-import org.apache.spark.rdd.RDD
-import org.apache.spark.sql.{DataFrame, SparkSession}
-
-import net.sansa_stack.inference.data.{RDFTriple, SQLSchema, SQLSchemaDefault}
+package net.sansa_stack.inference.data
 
 /**
   * A data structure that comprises a collection of triples. Note, due to the implementation of the Spark
@@ -14,8 +8,9 @@ import net.sansa_stack.inference.data.{RDFTriple, SQLSchema, SQLSchemaDefault}
   * @author Lorenz Buehmann
   *
   */
-abstract class AbstractRDFGraph[T, G <: AbstractRDFGraph[T, G]](val triples: T) { self: G =>
-
+abstract class AbstractRDFGraph[Rdf<: RDF, D, G <: AbstractRDFGraph[Rdf, D, G]](
+  val triples: D
+) { self: G =>
 
   /**
     * Returns a new RDF graph that contains only triples matching the given input.
@@ -25,20 +20,24 @@ abstract class AbstractRDFGraph[T, G <: AbstractRDFGraph[T, G]](val triples: T)
     * @param o the object
     * @return a new RDF graph
     */
-  def find(s: Option[String] = None, p: Option[String] = None, o: Option[String] = None): G
+  def find(s: Option[Rdf#Node] = None, p: Option[Rdf#Node] = None, o: Option[Rdf#Node] = None): G
+
+//  /**
+//    * Returns a new RDF graph that contains only triples matching the given input.
+//    *
+//    * @param filter the filter function
+//    * @return a new RDF graph
+//    */
+//  def find(filter: (Rdf#Triple) => Boolean): G
+//
+//  def find(subject: Rdf#NodeMatch, predicate: Rdf#NodeMatch, obj: Rdf#NodeMatch): G
 
   /**
     * Returns a new RDF graph that contains only triples matching the given input.
     *
     * @return a new RDF graph
     */
-  def find(triple: Triple): G = {
-    find(
-      if (triple.getSubject.isVariable) None else Option(triple.getSubject.toString),
-      if (triple.getPredicate.isVariable) None else Option(triple.getPredicate.toString),
-      if (triple.getObject.isVariable) None else Option(triple.getObject.toString)
-    )
-  }
+  def find(triple: Rdf#Triple): G
 
   /**
     * Returns a new RDF graph that contains the union of the current RDF graph with the given RDF graph.
@@ -56,6 +55,22 @@ abstract class AbstractRDFGraph[T, G <: AbstractRDFGraph[T, G]](val triples: T)
     */
   def unionAll(graphs: Seq[G]): G
 
+  /**
+    * Returns a new RDF graph that contains the intersection of the current RDF graph with the given RDF graph.
+    *
+    * @param graph the other RDF graph
+    * @return the intersection of both RDF graphs
+    */
+  def intersection(graph: G): G
+
+  /**
+    * Returns a new RDF graph that contains the difference between the current RDF graph and the given RDF graph.
+    *
+    * @param graph the other RDF graph
+    * @return the difference of both RDF graphs
+    */
+  def difference(graph: G): G
+
   /**
     * Returns a new RDF graph that does not contain duplicate triples.
     */
@@ -67,22 +82,4 @@ abstract class AbstractRDFGraph[T, G <: AbstractRDFGraph[T, G]](val triples: T)
     * @return the number of triples in the RDF graph
     */
   def size(): Long
-
-
-
-
-  def toDataFrame(sparkSession: SparkSession = null, schema: SQLSchema = SQLSchemaDefault): DataFrame
-
-  def toRDD(): RDD[RDFTriple]
-
-  /**
-    * Persist the triples RDD with the default storage level (`MEMORY_ONLY`).
-    */
-  def cache(): G
-
-//  /**
-//    * Broadcast the graph
-//    */
-//  def broadcast(): G
-
 }
@@ -0,0 +1,114 @@
+package net.sansa_stack.inference.data
+
+import org.apache.jena.datatypes.{BaseDatatype, RDFDatatype, TypeMapper}
+import org.apache.jena.graph.{Graph => JenaGraph, Node => JenaNode, Triple => JenaTriple, _}
+import org.apache.jena.rdf.model.{Literal => JenaLiteral, Seq => _}
+
+import scala.collection.JavaConverters._
+
+class JenaOps extends RDFOps[Jena]  {
+
+  // graph
+
+  val emptyGraph: Jena#Graph = Factory.createDefaultGraph
+
+  def makeGraph(triples: Iterable[Jena#Triple]): Jena#Graph = {
+    val graph: JenaGraph = Factory.createDefaultGraph
+    triples.foreach { triple =>
+      graph.add(triple)
+    }
+    graph
+  }
+
+  def getTriples(graph: Jena#Graph): Iterable[Jena#Triple] =
+    graph.find(JenaNode.ANY, JenaNode.ANY, JenaNode.ANY).asScala.to[Iterable]
+
+  // triple
+
+  def makeTriple(s: Jena#Node, p: Jena#URI, o: Jena#Node): Jena#Triple = {
+    JenaTriple.create(s, p, o)
+  }
+
+  def fromTriple(t: Jena#Triple): (Jena#Node, Jena#URI, Jena#Node) = {
+    val s = t.getSubject
+    val p = t.getPredicate
+    val o = t.getObject
+    if (p.isInstanceOf[Jena#URI])
+      (s, p.asInstanceOf[Jena#URI], o)
+    else
+      throw new RuntimeException("fromTriple: predicate " + p.toString + " must be a URI")
+  }
+
+  // node
+
+  def foldNode[T](node: Jena#Node)(funURI: Jena#URI => T, funBNode: Jena#BNode => T, funLiteral: Jena#Literal => T): T = node match {
+    case iri: Jena#URI => funURI(iri)
+    case bnode: Jena#BNode => funBNode(bnode)
+    case literal: Jena#Literal => funLiteral(literal)
+  }
+
+  // URI
+
+  def makeUri(iriStr: String): Jena#URI = { NodeFactory.createURI(iriStr).asInstanceOf[Node_URI] }
+
+  def fromUri(node: Jena#URI): String =
+    if (node.isURI)
+      node.getURI
+    else
+      throw new RuntimeException("fromUri: " + node.toString() + " must be a URI")
+
+  // bnode
+
+  def makeBNode(): Node_Blank = NodeFactory.createBlankNode().asInstanceOf[Node_Blank]
+
+  def makeBNodeLabel(label: String): Jena#BNode = {
+    val id = BlankNodeId.create(label)
+    NodeFactory.createBlankNode(id).asInstanceOf[Node_Blank]
+  }
+
+  def fromBNode(bn: Jena#BNode): String =
+    if (bn.isBlank)
+      bn.getBlankNodeId.getLabelString
+    else
+      throw new RuntimeException("fromBNode: " + bn.toString + " must be a BNode")
+
+  // literal
+
+  // TODO the javadoc doesn't say if this is thread safe
+  lazy val mapper = TypeMapper.getInstance
+
+  def jenaDatatype(datatype: Jena#URI) = {
+    val iriString = fromUri(datatype)
+    val typ = mapper.getTypeByName(iriString)
+    if (typ == null) {
+      val datatype = new BaseDatatype(iriString)
+      mapper.registerDatatype(datatype)
+      datatype
+    } else {
+      typ
+    }
+  }
+
+  val __xsdString: RDFDatatype = mapper.getTypeByName("http://www.w3.org/2001/XMLSchema#string")
+  val __xsdStringURI: Jena#URI = makeUri("http://www.w3.org/2001/XMLSchema#string")
+  val __rdfLangStringURI: Jena#URI = makeUri("http://www.w3.org/1999/02/22-rdf-syntax-ns#langString")
+
+  def makeLiteral(lexicalForm: String, datatype: Jena#URI): Jena#Literal =
+    if (datatype == __xsdStringURI)
+      NodeFactory.createLiteral(lexicalForm, null, null).asInstanceOf[Node_Literal]
+    else
+      NodeFactory.createLiteral(lexicalForm, null, jenaDatatype(datatype)).asInstanceOf[Node_Literal]
+
+  def makeLangTaggedLiteral(lexicalForm: String, lang: Jena#Lang): Jena#Literal =
+    NodeFactory.createLiteral(lexicalForm, fromLang(lang), null).asInstanceOf[Node_Literal]
+
+
+  // lang
+
+  def makeLang(langString: String) = langString
+
+  def fromLang(lang: Jena#Lang) = lang
+
+
+
+}
@@ -0,0 +1,14 @@
+package net.sansa_stack.inference.data
+
+import org.apache.jena.graph.{Node, Triple}
+
+/**
+  * @author Lorenz Buehmann
+  */
+trait JenaRDFTripleLike extends TripleOps[Jena] {
+//  self: Triple =>
+//
+//  override def s: Node = self.getSubject
+//  override def p: Node = self.getPredicate
+//  override def o: Node = self.getObject
+}
@@ -36,4 +36,7 @@ trait RDF {
     */
   type Lang
 
-}
+  // types for the graph traversal API
+  type NodeMatch
+  type NodeAny <: NodeMatch
+}
@@ -0,0 +1,33 @@
+package net.sansa_stack.inference.data
+
+/**
+  * @author Lorenz Buehmann
+  */
+trait RDFOps[Rdf <: RDF] {
+
+  // Triple
+  def makeTriple(s: Rdf#Node, p: Rdf#URI, o: Rdf#Node): Rdf#Triple
+  def fromTriple(triple: Rdf#Triple): (Rdf#Node, Rdf#URI, Rdf#Node)
+
+  // URI
+  def makeUri(s: String): Rdf#URI
+  def fromUri(uri: Rdf#URI): String
+
+  // blank node
+  def makeBNode(): Rdf#BNode
+  def makeBNodeLabel(s: String): Rdf#BNode
+  def fromBNode(bn: Rdf#BNode): String
+
+  // literal
+  def makeLiteral(lexicalForm: String, datatype: Rdf#URI): Rdf#Literal
+  def makeLangTaggedLiteral(lexicalForm: String, lang: Rdf#Lang): Rdf#Literal
+//  def fromLiteral(literal: Rdf#Literal): (String, Rdf#URI, Option[Rdf#Lang])
+
+  // lang
+  def makeLang(s: String): Rdf#Lang
+  def fromLang(l: Rdf#Lang): String
+}
+
+object RDFOps {
+  def apply[Rdf <: RDF](implicit ops: RDFOps[Rdf]): RDFOps[Rdf] = ops
+}
@@ -0,0 +1,15 @@
+package net.sansa_stack.inference.data
+
+/**
+  * @author Lorenz Buehmann
+  */
+class RDFVocab[Rdf <: RDF](implicit ops: RDFOps[Rdf]) {
+
+  import ops._
+
+  val `type`: Rdf#URI = makeUri("type")
+}
+
+object RDFVocab {
+  def apply[Rdf <: RDF](implicit ops: RDFOps[Rdf]): RDFVocab[Rdf] = new RDFVocab[Rdf]()
+}