使用sqluldr2实现将Oracle数据无落地快速导入Greenplum数据库
#=0x23,请下载对应的文件, 1000000) file = output file name(default: uldrdata.txt) log = log file name, 3. gpload简单介绍 gpload是GP中提供的用来进行数据装载的工具。
也避免了使用传统落地文件方式加载的过大存储开销,就不和GP参合到一起了, =0x0d =0x0a |=0x7c ,以及sqluldr2程序(用于oracle数据的快速卸载)实现从Oracle到GP无落地文件快速加载, 首先, 4. 实现Oracle数据直接并行加载到GP的原理 使用gpload, prefix with + to append mode fast = auto tuning the session level parameters(YES) text = output type (MYSQL。
所以编写控制文件是用好gpload的关键所在。
然后配置以下环境变量就可以了,如果你的环境是windows或者linux32位的。
添加到Oracle的家目录的.bashrc文件中: export ORACLE_BASE=/var/lib/oracle export ORACLE_HOME=/var/lib/oracle/product/11.2.0/dbhome_1 export LD_LIBRARY_PATH=$ORACLE_HOME/lib:/usr/lib export PATH=$ORACLE_HOME/bin:/sbin:/usr/sbin:/usr/ccs/bin:/usr/bin:/sbin:$PATH:/bin export TNS_NAMES=$ORACLE_HOME/network/admin export TNS_ADMIN=$ORACLE_HOME/network/admin # CLASSPATH must include the following JRE locations: CLASSPATH=${ORACLE_HOME}/rdbms/jlib:${CLASSPATH} export CLASSPATH=$CLASSPATH:/opt/oracle/product/11/network/jlib #将GP的环境信息也配置进来,我们可以实现无落地文件的并行快速加载,gpload.ctl内容如下: --- VERSION: 1.0.0.1 DATABASE: zhangyun_db USER: zhangyun HOST: CDHA PORT: 5432 GPLOAD: INPUT: - SOURCE: LOCAL_HOSTNAME: - CDHA PORT: 46666 FILE: - /var/lib/oracle/iphone_user_detail/iphone_user_detail_file - FORMAT: text - DELIMITER: E - NULL_AS: - ENCODING: utf8 - ERROR_LIMIT: 25 - ERROR_TABLE: err_iphone_user_detail OUTPUT: - TABLE: ann_gbs_safe.iphone_user_detail - MODE: INSERT 然后编写脚本export_iphone_user_detail.sh, you can use 0x to specify hex character code, CSV。
Parallel)。
所以依赖gpfdist组件,因为sqluldr2需要使用libclntsh.so等共享库。
5. 示例 场景:将Oracle的iphone_user_detail表加载到GP数据库的iphone_user_detail表中, 假如你想省事的话, size 0 MB. 1000000 rows exported at 2016-07-13 14:47:10,本章主要介绍将Oracle数据直接迁移到GP数据库中,确保GP中已经创建好了iphone_user_detail表, SEARCH). charset = character set name of the target database. ncharset= national character set name of the target database. parfile = read command option from parameter file for field and record,其可以看做是对gpfdist的封装,...] Valid Keywords: user = username/password@tnsname sql = SQL file name query = select statement field = separator string between fields record = separator string between records rows = print progress for every given rows (default。
gpload,并放到/var/lib/oracle下面: [root@CDHA oracle]# pwd /var/lib/oracle [root@CDHA oracle]# chown -R oracle:oinstall /var/lib/oracle [root@CDHA oracle]# ll drwxrwxrwx 3 oracle oinstall 4096 Jul 11 22:14 product -rwxrwxrwx 2 oracle oinstall 185766 Mar 13 2013 sqluldr2_linux64_10204.bin 最后我们配置Oracle的相关环境变量。
keyword=value, [oracle@CDHA ~]$ bash export_iphone_user_detail.sh 2016-07-13 14:47:00|INFO|gpload session started 2016-07-13 14:47:00 2016-07-13 14:47:00|INFO|started gpfdist -p 21211 -P 21212 -f /var/lib/oracle/iphone_user_detail/iphone_user_detail_file -t 30 0 rows exported at 2016-07-13 14:47:03, 我们可以将这个文件重新命名并放到下面的路径中或者建立一个软链接(这个路径我们已经配置到PATH中): [oracle@CDHA ~]$ pwd /var/lib/oracle [oracle@CDHA ~]$ ll product/11.2.0/dbhome_1/bin/ sqluldr2 -rwxrwxrwx 2 oracle oinstall 185766 Mar 13 2013 product/11.2.0/dbhome_1/bin/sqluldr2 我们来验证一下: [oracle@CDHA ~]$ sqluldr2 SQL*UnLoader: Fast Oracle Text Unloader (GZIP,一方面我们可以实现GP中不能直接实现的merge操作,并查看日志 在执行脚本之前。
我们创建gpload的控制文件。
=0x22 =0x27 可以看到非常详细的帮助说明, size 719 MB. 2000000 rows exported at 2016-07-13 14:47:18, ORACLEINS, size 2154 MB .. 等执行完成后,iphone_number from pps.iphone_user_detail field=0x01 charset=utf8 safe=yes FILE=/var/lib/oracle/iphone_user_detail/iphone_user_detail_file gpload -f gpload.ctl -V -l gpload.log rm -rf /var/lib/oracle/iphone_user_detail/iphone_user_detail_file 6. 执行export_iphone_user_detail.sh脚本, 这一块的内容我在博客中已经介绍过了, MYSQLINS,然后来单独配置Oracle环境变量,大家可以看一下,=0x2c, Greenplum:Greenplum Version: postgres (Greenplum Database) 4.3.8.2 build 1 Oracle:Release 11.2.0.1.0 Production 1. Oracle客户端部署 在使用sqluldr2工具之前。
也直接从Oracle服务器将安装目录拷贝过来,因此它必须得是有效的YAML格式, FORM, gpload通过它的控制文件指定装载的细节信息。
else 100 USD per server. Usage: SQLULDR2 keyword=value [,用于执行数据迁移工作: #!/bin/bash mknod /var/lib/oracle/iphone_user_detail/iphone_user_detail_file p sqluldr2 user=zy/[email protected]:1521/salesdb query=select /*+ parallel(8)*/ deptno,以及超大文件落地过程导致的加载性能瓶颈, 首先创建oracle用户组和用户: groupadd -g 1000 dba groupadd -g 10001 oinstall useradd -u 1002 -d /var/lib/oracle -s /bin/bash -g oinstall -G dba -m oracle passwd oracle 比如这里,就可以进入GP数据库中查看,首先需要在Greenplum(以下都称为GP)的Master节点部署Oracle客户端, 为了防止配置Oracle环境变量会影响GP数据库客户端工具的使用,我们单独给Oracle客户端创建一个用户,另外通过结合命名管道, 本文使用的方法是通过Linux的命名管道。
size 1451 MB. 3000000 rows exported at 2016-07-13 14:47:25, zhangyun_db=# select count(*) from iphone_user_detail; , Release 4.0.1 (@) Copyright Lou Fangxin (AnySQL.net) 2004 - 2010,我们就直接将Oracle服务器的软件安装目录 product 拷贝过来,fmi, =0x09,从而帮助我们提高海量数据加载效率,location, :=0x3a,gpload的控制文件采用YAML1.1文档格式编写。
all rights reserved. License: Free for non-commercial useage。
后面需要使用gpload访问GP数据库 source /usr/local/greenplum-db/greenplum_path.sh export MASTER_DATA_DIRECTORY=/hadoopdata1/master/gpseg-1 export PGPORT=5432 export PGUSER=gpadmin export PGDATABASE=template1 2. sqluldr2安装部署 下载sqluldr2_linux64_10204.bin文件,。
相关热词:
本站内容来源于网络,如有侵权请与我们联系,我们会及时删除,我们深感抱歉!
注:本站所有信息仅供用于网络技术学习参考,学习中请遵循相关法律法规!
本文地址: https://www.juheyunku.com/jiaob/net/10543.shtml
相关文章
热门TAG
命令 权重 外链 企业网站 白帽 php 织梦教程 dedecms修改内容 javascript 织梦 功能 标签 调用 详解 服务器 网站流量 实例解析 Dedecms 织梦cms HTML tags标签 python jquery教程 jquery windows SEO优化 蜘蛛 搜索引擎 网站收录 JSP最新文章
-
如何给asp.net core写个中间
时间:2021-01-03
-
.Net微信网页开发解决用户
时间:2021-01-03
-
c++中Socket通信函数之WSAS
时间:2020-12-29
-
提高生产性工具
时间:2020-12-29
-
全新的membership框架Asp.ne
时间:2020-12-29
-
不用找了,比较全的signal
时间:2020-12-29
-
计算字符串中每种字符出
时间:2020-12-29
-
EntityFramework 5.0 CodeFirst 教
时间:2020-12-29
热门文章
-
.NET 开发环境搭建图文详解
时间:2020-12-27
-
Windows下Visual Studio 2017安装配置方法图文教
时间:2020-12-23
-
.Net微信网页开发解决用户在不同公众号或
时间:2021-01-03
-
oracle 11g rac安装之grid报错解决
时间:2020-12-28
-
ASP.NET Core 3.0使用gRPC的具体方法
时间:2020-12-26
-
SpringBoot实战之文件上传存入AzureStorage
时间:2020-12-29
-
不用找了,比较全的signalR例子已经为你准
时间:2020-12-29
-
.NET Core3.1编写混合C++程序
时间:2020-12-26
-
Oracle的卸载
时间:2020-12-28
-
计算字符串中每种字符出现的次数[Dicti
时间:2020-12-29
