SANSA-Stack
diff --git a/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/RDFTuple.scala‎
Lines changed: 13 additions & 0 deletions b/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/RDFTuple.scala‎
Lines changed: 13 additions & 0 deletions
diff --git a/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/SQLSchema.scala‎
Lines changed: 15 additions & 0 deletions b/‎sansa-inference-common/src/main/scala/net/sansa_stack/inference/data/SQLSchema.scala‎
Lines changed: 15 additions & 0 deletions
diff --git a/‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/RDFGraphMaterializer.scala‎
Lines changed: 2 additions & 1 deletion b/‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/RDFGraphMaterializer.scala‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/abstraction/TypeComputorDefault.scala‎
Lines changed: 1 addition & 1 deletion b/‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/abstraction/TypeComputorDefault.scala‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/SQLSchema.scala‎
Lines changed: 0 additions & 18 deletions b/‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/SQLSchema.scala‎
Lines changed: 0 additions & 18 deletions
diff --git a/‎…nference/spark/data/RDFGraphLoader.scala‎ ‎…e/spark/data/loader/RDFGraphLoader.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/RDFGraphLoader.scala renamed to sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/loader/RDFGraphLoader.scala
Lines changed: 2 additions & 1 deletion b/‎…nference/spark/data/RDFGraphLoader.scala‎ ‎…e/spark/data/loader/RDFGraphLoader.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/RDFGraphLoader.scala renamed to sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/loader/RDFGraphLoader.scala
Lines changed: 2 additions & 1 deletion
diff --git a/‎…erence/spark/data/AbstractRDFGraph.scala‎ ‎…/spark/data/model/AbstractRDFGraph.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/AbstractRDFGraph.scala renamed to sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/model/AbstractRDFGraph.scala
Lines changed: 3 additions & 3 deletions b/‎…erence/spark/data/AbstractRDFGraph.scala‎ ‎…/spark/data/model/AbstractRDFGraph.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/AbstractRDFGraph.scala renamed to sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/model/AbstractRDFGraph.scala
Lines changed: 3 additions & 3 deletions
diff --git a/‎…/spark/data/EmptyRDFGraphDataFrame.scala‎ ‎…/data/model/EmptyRDFGraphDataFrame.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/EmptyRDFGraphDataFrame.scala renamed to sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/model/EmptyRDFGraphDataFrame.scala
Lines changed: 1 addition & 1 deletion b/‎…/spark/data/EmptyRDFGraphDataFrame.scala‎ ‎…/data/model/EmptyRDFGraphDataFrame.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/EmptyRDFGraphDataFrame.scala renamed to sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/model/EmptyRDFGraphDataFrame.scala
Lines changed: 1 addition & 1 deletion
diff --git a/‎…tack/inference/spark/data/RDFGraph.scala‎ ‎…nference/spark/data/model/RDFGraph.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/RDFGraph.scala renamed to sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/model/RDFGraph.scala
Lines changed: 1 addition & 1 deletion b/‎…tack/inference/spark/data/RDFGraph.scala‎ ‎…nference/spark/data/model/RDFGraph.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/RDFGraph.scala renamed to sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/model/RDFGraph.scala
Lines changed: 1 addition & 1 deletion
diff --git a/‎…rence/spark/data/RDFGraphDataFrame.scala‎ ‎…spark/data/model/RDFGraphDataFrame.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/RDFGraphDataFrame.scala renamed to sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/model/RDFGraphDataFrame.scala
Lines changed: 20 additions & 15 deletions b/‎…rence/spark/data/RDFGraphDataFrame.scala‎ ‎…spark/data/model/RDFGraphDataFrame.scala‎sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/RDFGraphDataFrame.scala renamed to sansa-inference-spark/src/main/scala/net/sansa_stack/inference/spark/data/model/RDFGraphDataFrame.scala
Lines changed: 20 additions & 15 deletions
@@ -0,0 +1,13 @@
+package net.sansa_stack.inference.data
+
+/**
+  * An RDF tuple `(s o)`, i.e. only subject and object are represented.
+  *
+  * @param s the subject
+  * @param o the object
+  * @author Lorenz Buehmann
+  */
+case class RDFTuple(s: String, o: String) extends Product2[String, String] {
+    override def _1: String = s
+    override def _2: String = o
+  }
@@ -0,0 +1,15 @@
+package net.sansa_stack.inference.spark.data.model
+
+/**
+  * The SQL schema used for RDF triples in a Dataframe.
+  *
+  * @param triplesTable the name of the triples table
+  * @param subjectCol   the name of the subject column
+  * @param predicateCol the name of the predicate column
+  * @param objectCol    the name of the object column
+  *
+  * @author Lorenz Buehmann
+  */
+class SQLSchema(val triplesTable: String, val subjectCol: String, val predicateCol: String, val objectCol: String) {}
+
+object SQLSchemaDefault extends SQLSchema("TRIPLES", "s", "p", "o") {}
@@ -8,7 +8,8 @@ import org.apache.spark.sql.SparkSession
 import net.sansa_stack.inference.data.RDFTriple
 import net.sansa_stack.inference.rules.ReasoningProfile._
 import net.sansa_stack.inference.rules.{RDFSLevel, ReasoningProfile}
-import net.sansa_stack.inference.spark.data.{RDFGraphLoader, RDFGraphWriter}
+import net.sansa_stack.inference.spark.data.loader.RDFGraphLoader
+import net.sansa_stack.inference.spark.data.writer.RDFGraphWriter
 import net.sansa_stack.inference.spark.forwardchaining.{ForwardRuleReasonerOWLHorst, ForwardRuleReasonerRDFS, ForwardRuleReasonerRDFSDataset, TransitiveReasoner}
 
 /**
 
@@ -9,7 +9,7 @@ import org.apache.spark.rdd.RDD
 import org.apache.spark.sql.{Dataset, SparkSession}
 
 import net.sansa_stack.inference.data.RDFTriple
-import net.sansa_stack.inference.spark.data.RDFGraphLoader
+import net.sansa_stack.inference.spark.data.loader.RDFGraphLoader
 
 /**
   * @author Lorenz Buehmann
 
@@ -1,4 +1,4 @@
-package net.sansa_stack.inference.spark.data
+package net.sansa_stack.inference.spark.data.loader
 
 import java.net.URI
 
@@ -9,6 +9,7 @@ import org.apache.spark.sql.{Dataset, SparkSession}
 import org.slf4j.LoggerFactory
 
 import net.sansa_stack.inference.data.RDFTriple
+import net.sansa_stack.inference.spark.data.model.{RDFGraph, RDFGraphDataFrame, RDFGraphDataset, RDFGraphNative}
 import net.sansa_stack.inference.utils.NTriplesStringToRDFTriple
 
 /**
 
@@ -1,10 +1,10 @@
-package net.sansa_stack.inference.spark.data
+package net.sansa_stack.inference.spark.data.model
 
 import org.apache.jena.graph.Triple
 import org.apache.spark.rdd.RDD
 import org.apache.spark.sql.{DataFrame, SparkSession}
 
-import net.sansa_stack.inference.data.RDFTriple
+import net.sansa_stack.inference.data.{RDFTriple, SQLSchema, SQLSchemaDefault}
 
 /**
   * A data structure that comprises a collection of triples. Note, due to the implementation of the Spark
@@ -71,7 +71,7 @@ abstract class AbstractRDFGraph[T, G <: AbstractRDFGraph[T, G]](val triples: T)
 
 
 
-  def toDataFrame(sparkSession: SparkSession = null): DataFrame
+  def toDataFrame(sparkSession: SparkSession = null, schema: SQLSchema = SQLSchemaDefault): DataFrame
 
   def toRDD(): RDD[RDFTriple]
 
 
@@ -1,4 +1,4 @@
-package net.sansa_stack.inference.spark.data
+package net.sansa_stack.inference.spark.data.model
 
 import org.apache.spark.sql.types.{StringType, StructField, StructType}
 import org.apache.spark.sql.{DataFrame, Row, SQLContext}
 
@@ -1,4 +1,4 @@
-package net.sansa_stack.inference.spark.data
+package net.sansa_stack.inference.spark.data.model
 
 import org.apache.jena.graph.Triple
 import org.apache.spark.rdd.RDD
 
@@ -1,18 +1,18 @@
-package net.sansa_stack.inference.spark.data
+package net.sansa_stack.inference.spark.data.model
 
-import org.apache.jena.graph.Triple
 import org.apache.spark.rdd.RDD
 import org.apache.spark.sql.{DataFrame, SparkSession}
 
-import net.sansa_stack.inference.data.RDFTriple
+import net.sansa_stack.inference.data.{RDFTriple, SQLSchema, SQLSchemaDefault}
 
 /**
   * A data structure that comprises a set of triples.
   *
   * @author Lorenz Buehmann
   *
   */
-class RDFGraphDataFrame(override val triples: DataFrame) extends AbstractRDFGraph[DataFrame, RDFGraphDataFrame](triples) {
+class RDFGraphDataFrame(override val triples: DataFrame, val schema: SQLSchema = SQLSchemaDefault)
+    extends AbstractRDFGraph[DataFrame, RDFGraphDataFrame](triples) {
 
   /**
     * Returns an RDD of triples that match with the given input.
@@ -23,17 +23,17 @@ class RDFGraphDataFrame(override val triples: DataFrame) extends AbstractRDFGrap
     * @return RDD of triples
     */
   override def find(s: Option[String] = None, p: Option[String] = None, o: Option[String] = None): RDFGraphDataFrame = {
-    var sql = "SELECT subject, predicate, object FROM TRIPLES"
+    var sql = s"SELECT ${schema.subjectCol}, ${schema.predicateCol}, ${schema.objectCol} FROM ${schema.triplesTable}"
 
     // corner case is when nothing is set, i.e. all triples will be returned
-    if(s.isDefined || p.isDefined || o.isDefined) {
+    if (s.isDefined || p.isDefined || o.isDefined) {
       sql += " WHERE "
 
       val conditions = scala.collection.mutable.ListBuffer[String]()
 
-      if(s.isDefined) conditions += "subject = '" + s.get + "'"
-      if(p.isDefined) conditions += "predicate = '" + p.get + "'"
-      if(o.isDefined) conditions += "object = '" + o.get + "'"
+      if (s.isDefined) conditions += s"${schema.subjectCol} = '${s.get}'"
+      if (p.isDefined) conditions += s"${schema.predicateCol} = '${p.get}'"
+      if (o.isDefined) conditions += s"${schema.objectCol} = '${o.get}'"
 
       sql += conditions.mkString(" AND ")
     }
@@ -43,7 +43,7 @@ class RDFGraphDataFrame(override val triples: DataFrame) extends AbstractRDFGrap
 
   /**
     * Return the union of the current RDF graph with the given RDF graph
- *
+    *
     * @param graph the other RDF graph
     * @return the union of both graphs
     */
@@ -58,10 +58,15 @@ class RDFGraphDataFrame(override val triples: DataFrame) extends AbstractRDFGrap
     // to limit the lineage, we convert to RDDs first, and use the SparkContext Union method for a sequence of RDDs
     val df: Option[DataFrame] = graphs match {
       case g :: Nil => Some(g.toDataFrame())
-      case g :: _ => Some(g.toDataFrame().sqlContext.createDataFrame(
-        g.toDataFrame().sqlContext.sparkContext.union(graphs.map(_.toDataFrame().rdd)),
-        g.toDataFrame().schema
-      ))
+      case g :: _ =>
+        Some(
+          g.toDataFrame()
+            .sqlContext
+            .createDataFrame(
+              g.toDataFrame().sqlContext.sparkContext.union(graphs.map(_.toDataFrame().rdd)),
+              g.toDataFrame().schema
+            )
+        )
       case _ => None
     }
     new RDFGraphDataFrame(df.get)
@@ -80,7 +85,7 @@ class RDFGraphDataFrame(override val triples: DataFrame) extends AbstractRDFGrap
     triples.count()
   }
 
-  def toDataFrame(sparkSession: SparkSession): DataFrame = triples
+  def toDataFrame(sparkSession: SparkSession, schema: SQLSchema = SQLSchemaDefault): DataFrame = triples
 
   def toRDD(): RDD[RDFTriple] = triples.rdd.map(row => RDFTriple(row.getString(0), row.getString(1), row.getString(2)))
Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-package net.sansa_stack.inference.spark.data`
	`1`	`+package net.sansa_stack.inference.spark.data.model`
`2`	`2`
`3`	`3`	`import org.apache.spark.sql.types.{StringType, StructField, StructType}`
`4`	`4`	`import org.apache.spark.sql.{DataFrame, Row, SQLContext}`