鱼C论坛

 找回密码
 立即注册
置顶 ·分享 本人最新博客(包含各种AI算法的原理剖析与实现,模型原理剖析与实现)
2020-6-13 19:32
博客地址: https://www.jianshu.com/u/ac22418e1795 ,欢迎喜欢AI的一起交流学习。鱼C博客至此不在更新。 现在已经更新的有,李航《统计学习方法》算法剖析与代码实现,HMM,CRF,unigram,Bigram,N-gram,word2vec,RNN,LSTM,BI-LSTM,transformer,Bert。
个人分类: 公开|8 次阅读|0 个评论
置顶 ·分享 迁移计划
2019-10-17 13:31
因为鱼C平台各种文本语法无法支持,转入`简书`平台,进行心得分享
个人分类: 公开|393 次阅读|0 个评论
置顶 ·分享 如何培养你沉稳的气质
2019-10-5 11:10
不要随意显露你的情绪 不要逢人就抱怨 征询意见之前自己先思考但不要先讲 不要一有机会就宣泄你的不满 学会讲话不要紧张
个人分类: 个人私密|410 次阅读|0 个评论
分享 markdown语法
2019-10-16 22:46
1. 使用#号标记 使用#号可表示1-6级标题,一级标题对应一个#号,二级标题对应两个#号,以此类推。 ``` #一级标题 ##二级标题 ###三级标题 ####四级标题 #####五级标题 ######六 ...
个人分类: Markdown|484 次阅读|0 个评论
分享 centos7设置静态IP地址
2019-10-11 15:17
TYPE="Ethernet" PROXY_METHOD="none" BROWSER_ONLY="no" BOOTPROTO="static" # 使用静态IP地址,默认为dhcp IPADDR="192.168.241.100" # 设置的静态IP地址 NETMASK="255.255.255.0" # 子网掩码 GATEWAY="192.168.241.2"  ...
个人分类: Linux|435 次阅读|0 个评论
分享 apache hive表创建(用于曙光数据集成平台)
2019-9-24 11:10
CREATE TABLE IF NOT EXISTS default.test567( id STRING, name STRING, email STRING ) CLUSTERED BY (name)INTO 3 BUCKETS ROW FORMAT DELIMITED STORED AS ORC TBLPROPERTIES('transactional'='true'); https://blog.csdn.net/weixin_36048246/article/details/89182704
个人分类: apache|303 次阅读|0 个评论
分享 数仓采集-日志生成代码编写
2019-9-23 22:03
? xml version ="1.0" encoding ="UTF-8" ? project xmlns ="http://maven.apache.org/POM/4.0.0" xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance" xsi :schemaLocation ="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4 ...
个人分类: 数仓|337 次阅读|0 个评论
分享 数仓采集-事件日志数据
2019-9-23 21:06
事件名称:loading 标签 含义 action 动作:开始加载=1,加载成功=2,加载失败=3 loading_time 加载时长:计算下拉开始到接口返回数据的时间,(开始加载报0,加载成功或加载失败才上报时间) loading_way 加载类型:1-读取缓存,2-从接口拉新数据 (加载成功才上报加载类型) extend1 扩展字段 ...
个人分类: 数仓|586 次阅读|0 个评论
分享 数仓采集-埋点数据基本格式
2019-9-23 17:04
公共字段:基本所有安卓手机都包含的字段 业务字段:埋点上报的字段,有具体的业务类型 客户端日志 { "ap":"xxxxx",//项目数据来源 app pc "cm": { //公共字段 "mi ...
个人分类: 数仓|445 次阅读|0 个评论
分享 数仓采集-测试集群服务器规划
2019-9-23 16:50
服务名称 子服务 服务器 hadoop102 服务器 hadoop103 服务器 hadoop104 HDFS NameNode √ DataNode √ √ √ SecondaryNameNode √ Yarn NodeManager √ √ √ Resourcemanager √ Zookeeper Zookeeper Server √ √ √ Flume(采集日志) Flume ...
个人分类: 数仓|317 次阅读|0 个评论
分享 数仓采集-集群资源规划设计
2019-9-23 16:49
1)如何确定集群规模?(假设:每台服务器8T磁盘,128G内存) 1.1 每天日活跃用户100万,每人一天平均100条:10000万条 1.2 每天日志1k左右,每天1亿条:约100G 1.3 半年内不扩容服务器来算:约18T &nbs ...
个人分类: 数仓|487 次阅读|0 个评论

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-3-29 13:47

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

返回顶部