BDA420

Spark in a Nutshell

Spark in Action - RDD

 from pyspark import SparkContext
  
spark = SparkSession \
        .builder \
        .appName("BDA420") \
        .config("spark.some.config.option", "some-value") \
        .getOrCreate()
 
path = "/FileStore/tables/frost.txt"
poem = spark.sparkContext.textFile(path)
print(poem.collect())
 
words = poem.map(lambda line: line.split(" "))
myList = words.collect()
print(myList)
print(len(myList)) from pyspark import SparkContext
  
spark = SparkSession \
        .builder \
        .appName("BDA420") \
        .config("spark.some.config.option", "some-value") \
        .getOrCreate()
 
path = "/FileStore/tables/frost.txt"
poem = spark.sparkContext.textFile(path)
print(poem.collect())
 
words = poem.map(lambda line: line.split(" "))
myList = words.collect()
print(myList)
print(len(myList)) from pyspark import SparkContext
  
spark = SparkSession \
        .builder \
        .appName("BDA420") \
        .config("spark.some.config.option", "some-value") \
        .getOrCreate()
 
path = "/FileStore/tables/frost.txt"
poem = spark.sparkContext.textFile(path)
print(poem.collect())
 
words = poem.map(lambda line: line.split(" "))
myList = words.collect()
print(myList)
print(len(myList)) from pyspark import SparkContext
  
spark = SparkSession \
        .builder \
        .appName("BDA420") \
        .config("spark.some.config.option", "some-value") \
        .getOrCreate()
 
path = "/FileStore/tables/frost.txt"
poem = spark.sparkContext.textFile(path)
print(poem.collect())
 
words = poem.map(lambda line: line.split(" "))
myList = words.collect()
print(myList)
print(len(myList))

Spark in Action - DataFrames

 from pyspark.sql import SparkSession
  
spark = SparkSession \
        .builder \
        .appName("BDA420") \
        .config("spark.some.config.option", "some-value") \
        .getOrCreate()
 
path = "/FileStore/tables/grades.csv"
data = spark.read.csv(path, header=True)
data.show()
 
data.filter(data['grades'] > 80).show() from pyspark.sql import SparkSession
  
spark = SparkSession \
        .builder \
        .appName("BDA420") \
        .config("spark.some.config.option", "some-value") \
        .getOrCreate()
 
path = "/FileStore/tables/grades.csv"
data = spark.read.csv(path, header=True)
data.show()
 
data.filter(data['grades'] > 80).show() from pyspark.sql import SparkSession
  
spark = SparkSession \
        .builder \
        .appName("BDA420") \
        .config("spark.some.config.option", "some-value") \
        .getOrCreate()
 
path = "/FileStore/tables/grades.csv"
data = spark.read.csv(path, header=True)
data.show()
 
data.filter(data['grades'] > 80).show() from pyspark.sql import SparkSession
  
spark = SparkSession \
        .builder \
        .appName("BDA420") \
        .config("spark.some.config.option", "some-value") \
        .getOrCreate()
 
path = "/FileStore/tables/grades.csv"
data = spark.read.csv(path, header=True)
data.show()
 
data.filter(data['grades'] > 80).show()

	from pyspark import SparkContext

	spark = SparkSession \
	.builder \
	.appName("BDA420") \
	.config("spark.some.config.option", "some-value") \
	.getOrCreate()

	path = "/FileStore/tables/frost.txt"
	poem = spark.sparkContext.textFile(path)
	print(poem.collect())

	words = poem.map(lambda line: line.split(" "))
	myList = words.collect()
	print(myList)
	print(len(myList))

	from pyspark.sql import SparkSession

	spark = SparkSession \
	.builder \
	.appName("BDA420") \
	.config("spark.some.config.option", "some-value") \
	.getOrCreate()

	path = "/FileStore/tables/grades.csv"
	data = spark.read.csv(path, header=True)
	data.show()

	data.filter(data['grades'] > 80).show()

BDA420

Apache Spark