Spark Core实战-将Tomcat日志分析的结果写入mysql数据库

1.Tomcat日志和前面一样

2.需求:

将Tomcat日志分析的结果:jps的名称和个数统计,并插入mysql数据库

3.在mysql(本地,我的是MacOS)中建库建表:

1
2
3
4
5
create database company;

create table mydata(
jsname varchar(50),
countNumber int(11));

4.编写代码:

(1)添加pom依赖:
1
2
3
4
5
6
<!-- https://mvnrepository.com/artifact/org.apache.spark/spark-core -->
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-core_2.11</artifactId>
<version>2.1.0</version>
</dependency>
(2)在项目中加入JDBC驱动包

JDBC驱动包

(3)MyTomcatLogCountToMysql.scala
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import java.sql.Connection
import java.sql.PreparedStatement
import java.sql.DriverManager


object MyTomcatLogCountToMysql {

def main(args: Array[String]): Unit = {

//创建Spark对象
val conf = new SparkConf().setMaster("local").setAppName("My Tomcat Log Count To Mysql")
val sc = new SparkContext(conf)

/**
* 读入日志,解析,找到访问jsp网页
* 192.168.88.1 - - [30/Jul/2017:12:54:42 +0800] "GET /MyDemoWeb/web.jsp HTTP/1.1" 200 239
*/

val rdd1 = sc.textFile("/users/macbook/TestInfo/localhost_access_log.txt")
.map(
/**
* 找到网页名字
*
* 并计数
*
* line 代表读进来的每一行数据
*/

line => {
//解析字符串,找到jsp名字
//得到两个双引号之间的东西
val index1 = line.indexOf("\"")
val index2 = line.lastIndexOf("\"")
val line1 = line.substring(index1 + 1, index2) // GET /MyDemoWeb/web.jsp HTTP/1.1

//得到两个空格之间的东西
val index3 = line1.indexOf(" ")
val index4 = line1.lastIndexOf(" ")
val line2 = line1.substring(index3 + 1, index4) // /MyDemoWeb/web.jsp

//得到jsp的名字
val jspName = line2.substring(line2.lastIndexOf("/") + 1)

(jspName, 1)
})

rdd1.foreachPartition(saveToMysql)

sc.stop()
}

//定义一个函数 针对分区进行操作
def saveToMysql(it: Iterator[(String, Int)]) = {

var conn: Connection = null
var pst: PreparedStatement = null

//创建连接
conn = DriverManager.getConnection("jdbc:mysql://localhost:3306/company?serverTimezone=UTC&characterEncoding=utf-8", "root", "123456")

//把数据保存到mysql中
pst = conn.prepareStatement("insert into mydata values (?,?) ")

it.foreach(data => {
pst.setString(1, data._1)
pst.setInt(2,data._2)
pst.executeUpdate()
})

}

}

5.结果:

1
2

打赏
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2015-2021 Movle
  • 访问人数: | 浏览次数:

请我喝杯咖啡吧~

支付宝
微信