本书的排版约定_精通Spark数据科学-QQ阅读男频轻小说网

书名：精通Spark数据科学
作者名：(美)安德鲁·摩根 (英)安托万·阿门德大卫·乔治马修·哈利特
本章字数：261字
更新时间：2025-03-31 16:24:07

本书的排版约定

在本书中，读者会发现一些不同的文本样式被用来区别不同种类的信息，下面是一些示例及其各自的含义。

在文本、数据库表名、文件夹名、文件名、文件扩展名、路径名、虚拟URL、用户输入信息、Twitter条目等位置出现的代码关键词用这样的方式展示：代码的下一行读取了链接，并将其分配给BeautifulSoup函数。

代码块的格式设置如下：

import org.apache.spark.sql.functions._

val rdd = rawDS map GdeltParser.toCaseClass
val ds = rdd.toDS()
// DataFrame-style API
ds.agg(avg("goldstein")).as("goldstein").show()

如果要吸引你注意代码块中的特定部分，相关的行或项目会被加粗：

spark.sql("SELECT V2GCAM FROM GKG LIMIT 5").show
spark.sql("SELECT AVG(GOLDSTEIN) AS GOLDSTEIN FROM GKG WHERE GOLDSTEIN IS
NOT NULL").show()

新词和重要的关键词会由加粗的字体显示。

这里出现的是警告或者重要的注意点。

这里出现的是提示和技巧。