- 精通Spark数据科学
- (美)安德鲁·摩根 (英)安托万·阿门德 大卫·乔治 马修·哈利特
- 261字
- 2021-01-15 16:45:33
本书的排版约定
在本书中,读者会发现一些不同的文本样式被用来区别不同种类的信息,下面是一些示例及其各自的含义。
在文本、数据库表名、文件夹名、文件名、文件扩展名、路径名、虚拟URL、用户输入信息、Twitter条目等位置出现的代码关键词用这样的方式展示:代码的下一行读取了链接,并将其分配给BeautifulSoup函数。
代码块的格式设置如下:
import org.apache.spark.sql.functions._
val rdd = rawDS map GdeltParser.toCaseClass
val ds = rdd.toDS()
// DataFrame-style API
ds.agg(avg("goldstein")).as("goldstein").show()
如果要吸引你注意代码块中的特定部分,相关的行或项目会被加粗:
spark.sql("SELECT V2GCAM FROM GKG LIMIT 5").show
spark.sql("SELECT AVG(GOLDSTEIN) AS GOLDSTEIN FROM GKG WHERE GOLDSTEIN IS
NOT NULL").show()
新词和重要的关键词会由加粗的字体显示。
这里出现的是警告或者重要的注意点。
这里出现的是提示和技巧。