一、目的
CDH搭建solrcloud集群,创建实例并且上传zookeeper管理。在此基础上,创建集合实例。
二、环境
1、 Centos7.4;
2、 CHD5.15.2;
三、创建实例
1、 在某一个solr节点上创建默认配置文件(instancedir);
solrctl instancedir --generate /var/lib/solr/test_conf
2、 .创建实例并将配置文件上传到zookeeper;
solrctl instancedir --create test /var/lib/solr/test_conf
备注:上传到zookeeper的配置文件名:test
3.#在Zookeeper查看配置文件
zookeeper-client
查看
[zk: localhost:2181(CONNECTED) 1] ls /solr/configs
[collection2, test, schemalessTemplateSecure, managedTemplate, schemalessTemplate, managedTemplateSecure, predefinedTemplate, predefinedTemplateSecure]
4.#查看创建的solrhome的实例
[root@i-0zntands lib]# solrctl instancedir --list*
collection2
managedTemplate
managedTemplateSecure
predefinedTemplate
predefinedTemplateSecure
schemalessTemplate
schemalessTemplateSecure
test
5.#创建 collection
(1)创建test
*solrctl collection --create test -s 2 -c test -r 2 -m 3
(2)创建test2
solrctl collection --create test2 -s 2 -c test -r 2 -m 3
其中
[-s <numShards>]
[-a Create collection with autoAddReplicas=true]
[-c <collection.configName>]
[-r <replicationFactor>]
[-m <maxShardsPerNode>]
[-n <createNodeSet>]]
** *注意:numShards*replicationFactor <= maxShardsPerNode*numNode** *
6.#更新配置,更新后新建的索引会按更新后的配置创建,之前的不变。
(1)修改配置文件并且上传
[root@i-0zntands lib]# solrctl instancedir --update test /var/lib/solr/test_conf
Uploading configs from /var/lib/solr/test_instancedir/conf to i-0zntands:2181,i-6ox7jdm2:2181,i-21jclmdn:2181/solr. This may take up to a minute.*
(2)重新加载实例
[root@i-0zntands lib]# solrctl collection --reload test
[root@i-0zntands lib]# solrctl collection --reload test2
7、 参考:;
https://blog.csdn.net/Dr_Guo/article/details/78669052
四、solrj实现连接solr实例
1、 pom依赖;
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>BG</groupId>
<artifactId>Hadoop</artifactId>
<version>1.0-SNAPSHOT</version>
<repositories>
<repository>
<id>cloudera</id>
<url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
</repository>
</repositories>
<properties>
<hadoop.version>2.6.0-cdh5.15.2</hadoop.version>
<hbase.version>1.2.0-cdh5.15.2</hbase.version>
<solr.version>4.10.3-cdh5.7.0</solr.version>
<maven.compiler.source>1.8</maven.compiler.source>
<maven.compiler.target>1.8</maven.compiler.target>
</properties>
<dependencies>
<!-- <dependency>-->
<!-- <groupId>org.apache.hadoop</groupId>-->
<!-- <artifactId>hadoop-common</artifactId>-->
<!-- <version>2.5.0-cdh5.2.0</version>-->
<!-- </dependency>-->
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-client</artifactId>
<version>${hadoop.version}</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>${hadoop.version}</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-hdfs</artifactId>
<version>${hadoop.version}</version>
</dependency>
<!--solr-->
<dependency>
<groupId>org.apache.solr</groupId>
<artifactId>solr-solrj</artifactId>
<version>${solr.version}</version>
</dependency>
<!-- https://mvnrepository.com/artifact/mysql/mysql-connector-java -->
<dependency>
<groupId>mysql</groupId>
<artifactId>mysql-connector-java</artifactId>
<version>5.1.27</version>
</dependency>
<dependency>
<groupId>org.apache.httpcomponents</groupId>
<artifactId>httpclient</artifactId>
<version>4.5.6</version>
</dependency>
<dependency>
<groupId>org.apache.httpcomponents</groupId>
<artifactId>httpcore</artifactId>
<version>4.4.1</version>
</dependency>
<dependency>
<groupId>junit</groupId>
<artifactId>junit</artifactId>
<version>4.10</version>
<scope>test</scope>
</dependency>
<!-- https://mvnrepository.com/artifact/org.apache.commons/commons-lang3 -->
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-lang3</artifactId>
<version>3.8.1</version>
</dependency>
</dependencies>
</project>
2、 代码;
package solr;
import org.apache.solr.client.solrj.impl.CloudSolrServer;
import org.apache.solr.common.SolrInputDocument;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
public class IndexManagercluster {
/**
* 基于cdh5.15.2的solr cloud实现建立索引,
* @throws Exception
*/
public void addDocument() throws Exception{
//使用SolrJ连接集群
//参数:zkHost是一个zookeeper集群列表
String zkHost="ip1:2181,ip2:2181,ip3:2181/solr";
CloudSolrServer solrserver=new CloudSolrServer(zkHost);
//设置默认的实例collection
solrserver.setDefaultCollection("test_ik5");
//创建一个文档对象
SolrInputDocument document=new SolrInputDocument();
document.setField("id","let's try id=1");
document.setField("title","title is hello world");
//提交文档
solrserver.add(document);
//提交修改
solrserver.commit();
}
public static void main(String[] args) throws Exception{
new IndexManagercluster().addDocument();
}
}
3、 注意点;
(1)zookeeper的地址时所有zookeeper的地址,而且后面要添加“/solr”。而apache版本是不需要添加的。这个两者有区别。
版权声明:本文不是「本站」原创文章,版权归原作者所有 | 原文地址:
一、功能
在cdh集群的solr环境中添加ik分词器,从而可以实现对中文的友好分词。
二、环境
1、 centos7.4;
2、 cdh5.15.2;
三、步骤
1、 上传ik分词器jar包到;
cd /opt/cloudera/parcels/CDH/lib/solr/webapps/solr/WEB-INF/lib/IKAnalyzer2012FF_u1.jar
chmod 777 IKAnalyzer2012FF_u1.jar
ll | grep IKAnalyzer2012FF_u1
2、 上传配置文件到所有solr服务器节点;
(1)在/data/cloudera/parcels/CDH-5.10.0-1.cdh5.10.0.p0.41/lib/solr/webapps/solr/WEB-INF/下创建classes
mkdir classes
(2)上传ik分词器的三个文件
ext.dic *IKAnalyzer.cfg.xml *stopword.dic
(3)修改权限
chmod 777 ./*
3、 重启cdhsolr服务;
切记一定做这一步,否则会报错
4、 在主节点上执行创建instancedir;
solrctl instancedir --generate /var/lib/solr/test_ik_conf
5、 修改schema;
cd /var/lib/solr/test_ik_conf/conf
vi schema.xml
在schema.xml的types标签中添加
<!-- IKAnalyzer-->
<fieldType name="text_ik" class="solr.TextField">
* <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
</types>
6、 添加域名;
标签fields中添加一个域
<field name="content_ik" type="text_ik" indexed="true" stored="true" />
7、 创建实例并且上传配置文件:;
solrctl instancedir --create test_ik /var/lib/solr/test_ik_conf
8、 创建分片:;
solrctl collection --create test_ik -s 2 -c test_ik -r 2 -m 3
-c:指的是配置文件
9、 更新配置;
(1)更新上传配置文件
solrctl instancedir --update test_ik /var/lib/solr/test_ik_conf
(2)重新加载collection
solrctl collection --reload test_ik #重新加载collection
(3)重新创建collection
solrctl collection --create test_ik5 -s 2 -c test_ik -r 1 -m 3
四、代码:实现cdhsolj上传建立索引
package solr;
import org.apache.solr.client.solrj.impl.CloudSolrServer;
import org.apache.solr.common.SolrInputDocument;
public class solrcloudIndexManager {
* * public void addDocument() throws *Exception{
* * * * //使用SolrJ连接集群
* * * * //参数:zkHost是一个zookeeper集群列表
* * * * String zkHost="zk1:2181,zk2:2181,zk3:2181/solr";
* * * * CloudSolrServer solrserver=new CloudSolrServer(zkHost);
* * * * //设置默认的实例collection
* * * * solrserver.setDefaultCollection("test_ik5");
* * * * //创建一个文档对象
* * * * SolrInputDocument document=new SolrInputDocument();
* * * * document.setField("id","solr test 02");
* * * * document.setField("title","solr world:6666666666666");
* * * * //提交文档
* * * * solrserver.add(document);
* * * * //提交修改
* * * * solrserver.commit();
* * }
* * public static void main(String[] args) throws Exception{
// * * * *new solrcloudIndexManager().importAllItems();
* * * * new solrcloudIndexManager().addDocument();
* * }
}
版权声明:本文不是「本站」原创文章,版权归原作者所有 | 原文地址: