sparkSQL 连接读取Oracle数据库

发布时间：2025-02-10 02:37

参加Oracle Certified Professional培训，精通Oracle数据库操作 #生活技巧# #工作学习技巧# #工作技能认证#

最新推荐文章于 2024-12-08 19:42:25 发布

thinklog2018 于 2018-06-05 10:35:27 发布

类似于mysql的连接方式，不过稍有细节差别。

1. Oracle数据库在安装后一般会在$ORACLE_HOME/jdbc/lib目录中放置ojdbc*.jar等jar文件，将这些文件复制到spark集群服务器上，比如$SPARK_HOME/jars/中，然后修改CLASSPATH=$SPARK_HOME/jars/ojdbc6.jar:$CLASSPATH

2. 重启jupyter notebook

3. 连接读取oracle数据库

from pyspark.sql import SparkSession

try:
sc.stop()
except:
pass

spk = SparkSession.builder.master("spark://192.168.12.7:7077").appName("spark-oracle").getOrCreate()
print(spk)
sc11=spk.sparkContext
print(sc11)

#从oracle 数据库表中读取数据到spark，如果要使用sql语句，则必须添加别名alias，比如下面的t
sqltext="(select col1,col2,col3 from tablename) t"
jdbcdf = spk.read.format('jdbc').options(
    url='jdbc:oracle:thin:@//192.168.2.7:1521/dbname',
    dbtable=sqltext,
    user='username',
    password='password'
).load()
print(jdbcdf)
jdbcdf.createOrReplaceTempView('ls')
spk.sql("select * from ls).show()

sc11.stop()

网址：sparkSQL 连接读取Oracle数据库 https://www.yuejiaxmz.com/news/view/764145

⬅️上一篇：AI家居加盟，智能生活，共创未来

➡️下一篇：智能家居(一种叫AI的家居生活)

sparkSQL 连接读取Oracle数据库

相关内容

随便看看

最新动态分享

热点动态分享

专题

推荐动态分享