第5课：彻底精通Scala隐式转换和并发编程及Spark源码阅读（1）

无量天尊Spark

1709

收藏 2016-04-01

一、隐式转换

1) 隐式转换案例

复制代码

先调用 D2C转换函数将new D()转换成C类, 然后调用C类的printC方法；但发现传入的参数类型是B类，于是搜索当前范围有无合适的转换函数，发现B2C转换函数符合要求。

2) 隐式操作规则

隐式定义是指编译器为了修正类型错误而允许插入到程序中的定义。例如，如果x + y 不能通过类型检查，那么编译器就可能把它修改为convert（x) + y , 这里的convert实质可用的隐式转换。

例如：scala> val a = 4

a: Int = 4

scala> val b = "3"

b: String = 3

scala> def sum(x: Int, y: Int) = x + y

sum: (x: Int, y: Int)Int

scala> sum(a, b)

<console>:13: error: type mismatch;

found : String

required: Int

sum(a, b)

此时类型不匹配,我们添加一个函数：

scala> implicit def str2Int(str: String)= Integer.valueOf(str).toInt

warning: there were 1 feature warning(s);re-run with -feature for details

str2Int: (str: String)Int

再次执行：scala> sum(a, b)

res4: Int = 7

此时b 被转成了我们期待的Int 类型，对于函数sum 来说 convert 就是str2Int，此时如果还有其他的函数也有类型转换的需求就可以简化代码。隐式转换由下面的规则掌控：

a) 标记规则：只有标记为implicit 的定义才是可用的。implicit 关键字用来标记编译器可以用于隐式转换，可以使用它标记任何变量、函数，对象、参数。

Spark源码中的隐式对象：

复制代码

这里创建SequenceFileRDD时使用了隐式的key,value 对象来做转换。

隐式方法：

复制代码

RDD的伴生对象中提供的implicit方法。

Word count程序中 sc.textFile(“/usr/local/word.txt”).flatMap(_.split(“\\s+”).map((_,1)).reduceByKey(_+_).collect

就调用了这implicit 方法。

隐式参数：

复制代码

这里我们用sc.textFile读取hadoop上的文件是，hadoopFile 使用隐式参数km,vm保存了输入hadoop输入的key、value类型信息。

b) 作用域规则：插入的隐式转换必须以单一的标示符形式处于作用域中，或者与转换的源或目标类型关联在一起，scala编译器仅仅考虑处于作用域之内的隐式转换。

例如上面的word count程序sc.textFile 方法调用后会产生HadoopRDD 而hadoopRDD中并没有flatMap方法，而hadoopRDD的父类中的RDD的伴生对象object RDD中有flatMap方法此时编译器就会调用。

object RDD中的：

复制代码

方法来创建MapPartitionsRDD，这样每次RDD转换时，编译器都会从object RDD 查找此RDD没有定义的方法来实现关联，这样就不需要在程序中单独引用转换了。

c) 无歧义规则：隐式转换只有不存在其他可以插入的转换前提下才能插入，此时编译器会报错。以之前隐式操作规则那小节的案例说明:

我们继续定义一个strt 到Int 的转换：

scala> implicit def str2Int2(str: String) =Integer.valueOf(str).toInt

warning: there were 1 feature warning(s);re-run with -feature for details

tr2Int2: (str: String)Int

我们再次调用 sum方法;

sum(a, b)

<console>:17: error: type mismatch;

found : String

required: Int

Note that implicit conversions are notapplicable because they are ambiguous:

both method str2Int of type (str: String)Int

and method str2Int2 of type (str:String)Int

are possible conversion functions fromString to Int

sum(a, b)

此时编译器拒绝了我们定义的隐式转换。

d) 命名隐式转换：隐式转换可以任意命名，因为编译器是通过方法的参数信息来推断应该来调用哪个方法，而不是方法的名称。最佳实践：方法名称就能看出此方法是做了是么转换：

复制代码

此方法名称rddToPairRDDFunctions 表明是将RDD转换成PairRDDFunctions

3) 隐式参数

由运行时上下文实际赋值注入的参数，不需要手动赋值，自动完成。一般到隐式参数类型的伴生对象中去找隐式值。

scala> classLevel(val level : Int)

defined class Level

scala> implicitval lelvel = new Level(9)

lelvel: Level =Level@12028586

scala> deftoWorker(name: String)(implicit level: Level) {println(name + ":" +level.level)}

toWorker: (name:String)(implicit level: Level)Unit

scala>toWorker("wjl")

wjl:9

注意val 本身也被标记为implicit，如果不是的话编译器就不能使用它。Implicit关键字是作用于全体参数列表，而不是单独的参数。

scala> val a = 4

a: Int = 4

scala> implicitval b = "s"

b: String = s

scala> implicitval c = 56

c: Int = 56

scala> defsum(x: Int)(implicit y: Int, z: String) = x + y + z

sum: (x:Int)(implicit y: Int, implicit z: String)String

scala> sum(4)

res4: String = 60s

从REPL的显示我们看到z也被加上了implicit 关键字。

4) 隐式对象

scala> abstract class Template[T] {

| def add(x: T, y: T): T

| }

defined class Template

scala> abstract class SubTemplate[T]extends Template[T] {

| def unit: T

| }

defined class SubTemplate

scala> implicit object StringAdd extendsSubTemplate[String] {

| override def add(x: String, y: String) = x concat y

| override def unit: String = ""

| }

defined module StringAdd

scala> implicitobject IntAdd extends SubTemplate[Int] {

| override def add(x: Int, y: Int) = x + y

| override def unit: Int = 0

| }

defined moduleIntAdd

scala> def sum[T](xs: List[T])(implicit m:SubTemplate[T]): T = {

| if (xs.isEmpty) m.unit

| else m.add(xs.head, sum(xs.tail))}

sum: [T](xs:List[T])(implicit m: SubTemplate[T])T

scala>println(sum(List(1, 2, 3, 4, 5)))

scala>println(sum(List("Scala", "Spark", "Kafka")))

ScalaSparkKafka

这里利用了scala的类型推断功能，传入不同的类型调用不同的函数，传入String 类型的List时T 被替换成String ，传入Int类型时T被替换成 Int。

5) 隐式类

scala> objectContext_Helper{

| implicit class FileEnhancer(file : File){

| def read = Source.fromFile(file.getPath).mkString

| }

| implicit class Op(x:Int){

| def addSAP(second: Int) = x + second

| }

defined moduleContext_Helper

scala> importContext_Helper._

importContext_Helper._

scala> println(1.addSAP(2))

这里1 没有 addSAP 方法，首先回到RichInt 里面去找，然后到运行的上下文中去找，然后到Context_Helper.中直接调用addSAP方法，这里并没有返回一个对象而是直接调用。原因是这里隐式类Op在构造的时候，传入了1 这个参数，然后调用了Op 对象的addSAP方法。

总结：implicit 1.从当前类的伴生对象中找 2. 把所有的隐式转换放在一个object中，然后导入3.从当前作用域中的隐式转换中找 4 在用到隐式转换的时候定义或者导入。

最佳实践：在伴生对象中定义隐式转换

复制代码

注：本学习笔记来自DT大数据梦工厂

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群