<演讲嘶吼之禅中文版>中文版谁有!!发邮箱Q:7...

&>&演讲之禅:一位技术演讲家的自白
演讲之禅:一位技术演讲家的自白
上传大小:14.34MB
技术人或者程序员也应该学习演讲的方法以及制作演讲稿的技巧,现在越来越看重复合性人才,全栈工程师已经不足以满足要求,TBD全链条复合才是优势。
综合评分:1(1位用户评分)
所需积分:
下载个数:2
{%username%}回复{%com_username%}{%time%}\
/*点击出现回复框*/
$(".respond_btn").on("click", function (e) {
$(this).parents(".rightLi").children(".respond_box").show();
e.stopPropagation();
$(".cancel_res").on("click", function (e) {
$(this).parents(".res_b").siblings(".res_area").val("");
$(this).parents(".respond_box").hide();
e.stopPropagation();
/*删除评论*/
$(".del_comment_c").on("click", function (e) {
var id = $(e.target).attr("id");
$.getJSON('/index.php/comment/do_invalid/' + id,
function (data) {
if (data.succ == 1) {
$(e.target).parents(".conLi").remove();
alert(data.msg);
$(".res_btn").click(function (e) {
var q = $("#form1").serializeArray();
console.log(q);
var res_area_r = $.trim($(".res_area_r").val());
if (res_area_r == '') {
$(".res_text").css({color: "red"});
$.post("/index.php/comment/do_comment_reply/", q,
function (data) {
if (data.succ == 1) {
var $target,
evt = e || window.
$target = $(evt.target || evt.srcElement);
var $dd = $target.parents('dd');
var $wrapReply = $dd.find('.respond_box');
console.log($wrapReply);
var mess = $(".res_area_r").val();
var str = str.replace(/{%header%}/g, data.header)
.replace(/{%href%}/g, 'http://' + window.location.host + '/user/' + data.username)
.replace(/{%username%}/g, data.username)
.replace(/{%com_username%}/g, _username)
.replace(/{%time%}/g, data.time)
.replace(/{%id%}/g, data.id)
.replace(/{%mess%}/g, mess);
$dd.after(str);
$(".respond_box").hide();
$(".res_area_r").val("");
$(".res_area").val("");
$wrapReply.hide();
alert(data.msg);
}, "json");
/*删除回复*/
$(".rightLi").on("click",'.del_comment_r', function (e) {
var id = $(e.target).attr("id");
$.getJSON('/index.php/comment/do_comment_del/' + id,
function (data) {
if (data.succ == 1) {
$(e.target).parent().parent().parent().parent().parent().remove();
$(e.target).parents('.res_list').remove()
alert(data.msg);
//填充回复
function KeyP(v) {
$(".res_area_r").val($.trim($(".res_area").val()));
评论共有1条
文件损坏,没法看
审核通过送C币
编程快速入门(英文原版)
创建者:dream_oneone
图像工程 第三版 上中下三册 张毓晋
创建者:xihuannini
数据挖掘导论中文版ppt
创建者:ulando
上传者其他资源上传者专辑
课程资源热门标签
VIP会员动态
前端开发重难点
17年软考最新真题及解析
物联网全栈开发专题
二十大技术领域优质资源
spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip
CSDN&VIP年卡&4000万程序员的必选
演讲之禅:一位技术演讲家的自白
会员到期时间:
剩余下载个数:
剩余C币:0
剩余积分:6726
积分不足!
资源所需积分
当前拥有积分
您可以选择
程序员的必选
绿色安全资源
资源所需积分
当前拥有积分
当前拥有C币
(仅够下载10个资源)
全站1200个资源免积分下载
资源所需积分
当前拥有积分
当前拥有C币
全站1200个资源免积分下载
资源所需积分
当前拥有积分
当前拥有C币
您的积分不足,将扣除 10 C币
全站1200个资源免积分下载
你当前的下载分为234。
你还不是VIP会员
开通VIP会员权限,免积分下载
你下载资源过于频繁,请输入验证码
你下载资源过于频繁,请输入验证码
您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:!
若举报审核通过,可奖励20下载分
被举报人:
举报的资源分:
请选择类型
资源无法下载
资源无法使用
标题与实际内容不符
含有危害国家安全内容
含有反动***等内容
含广告内容
版权问题,侵犯个人或公司的版权
*详细原因:
演讲之禅:一位技术演讲家的自白今天看啥 热点:
kaggle数据挖掘竞赛初步--Titanic&数据变换&,kaggle--titanic完整代码:&/cindycindyhi/kaggle-Titanic
特征工程系列:
Titanic系列之原始数据分析和数据处理
Titanic系列之数据变换
Titanic系列之派生属性&维归约
缺失值填充之后,就要对其他格式有问题的属性进行处理了。比如Sex Embarked这些属性的值都是字符串类型的,而scikit learn中的模型都只能处理数值型的数据,需要将这些原始的字符串类型的数据转为数值型数据。所有数据通常可以分成两种类型:定量与定性。定量的属性(数值属性)通常蕴涵着可排序性,比如在泰坦尼克号数据集中,年龄就是一个定量属性。定性属性(标称 序数 二元属性)的值是一些符号或事务的名称,每个值代表某种类别编码或状态,不是可测量量,是不具有排序意义的,比如Embarked(登船地点)。
一 定性属性的数据变换
对于字符串型的定性属性转换,如果单纯的用数字来代替的化,比如对于Embarked的三个值S Q C分别用1 2 3来代替,模型会把它当成是有顺序的数值属性,对于一些根据距离来确定分类的算法来说,就不能准确运行啦。那么应该怎么将定性属性转为数字呢?
(1)dummy varibles(不知道中文应该说成啥。。虚设属性?)
什么是dummy呢,举个栗子,Emarked属性的取值有三个S Q C,分别代表三个上船地点。dummy这个属性呢,就是向数据集里再加入三个属性暂且命名为Embarked_S Embarkde_Q 和Embarked_C,如果一个人是在S地点上船的,那么这三个属性的值就是(1,0,0),在Q点上船的就是(0,1,0),每个属性都是二元属性,1代表是,0代表否。所以dummy适用于值范围相对较少的属性。
import pandas as pd    #creat dummy varibles from raw data
dummies_df = pd.get_dummies(df.Embarked)
#remana the columns to Embarked_S...
dummies_df = dummies_df.rename(columns=lambda x:'Embarked_'+str(x))
df = pd.concat([df,dummies_df],axis=1)
这样就会3个dummy属性加到数据集里啦,用df.info()看一下:
(2)factorizing(因子***?)
用dummy可以处理像Embarked这样的值域范围较小的标称属性。对于Cabin(船舱号,A43 B55这种)这种标称属性,用dummy就不好处理了。pandas提供了一个factorize()函数,用以将标称属性的字符串值映射为一个数字,相同的字符串映射为同一个数字。不同于dummy,这种映射最后只生成一个属性。对于Cabin属性,我们可以将其分成两部分,字符串+数字,新建两个属性。对于字符串(A-E & U),可以用factorize()将其处理成数字。
df['CabinLetter'] = df['Cabin'].map( lambda x: re.compile("([a-zA-Z]+)").\
search(x).group() )
df['CabinLetter'] = pd.factorize(df.CabinLetter)[0]
上一步呢,只是把Cabin船舱号前面的字母提出来作为一个新的属性,船舱号中的数字当然也要提出来作为一个新的属性啦。
1 #plus one for laplace assumption
2 df['CabinNumber'] = df['Cabin'].map( lambda x: getCabinNumber(x) ).\
astype(int) +1
4 def getCabinNumber(cabin):
match = re.compile("([0-9]+)").search(cabin)
return match.group()
二 定量属性的数据变换
&(1)数据规范化
数据规范化通过将数据压缩到一个范围内(通常是0-1或者-1-1)赋予所有属性相等的权重。对于涉及神经网络的分类算法或者基于距离度量的分类和聚类,规范化特别有用。规范化方法有多种,如rescaling logarithmic normalize等,可以在这里找到各种规范化方法的具体实现。但是有些时候并不需要规范化,比如算法使用相似度函数而不是距离函数的时候,比如随机森林,它从不比较一个特征与另一个特征,因此也不许要规范化,关于这个问题,详细信息可以参考这篇文章www.faqs.org/faqs/ai-faq/neural-nets/part2/section-16.html
如果对Age属性进行规范化的话(看最后分类算法使用哪种再确定要不要规范化,如果要规范化的话,其他属性也要处理),代码如下:
if keep_scaled:
scaler = preprocessing.StandardScaler()
df['Age_Scaled'] = scaler.fit_transform(df['Age'])
StandardScaler将数值压缩到[-1,1]区间,计算公式为(2x - max(x) - min(x)) / (max(x) - min(x)).
(2)Binning
就像直方图的bin将数据划分成几块一样,我们也可以将数值属性划分成几个bin,这是一种连续数据离散化的处理方式。我们使用pandas.qcut()函数来离散化连续数据,它使用分位数对数据进行划分,可以得到大小基本相等的bin。以下以Fare(船票价格)为例,对于其他连续属性如Age SibSp等也可以划分成bin。
1 def processFare():
df['Fare'][df.Fare.isnull()] = df.Fare.dropna().mean()
#zero values divide -- laplace
df['Fare'][np.where(df['Fare']==0)[0]] = df['Fare'][df.Fare.\
nonzero()[0] ].min() / 10
df['Fare_bin'] = pd.qcut(df.Fare, 4)
这样产生的df['Fare_bin']的值是这样的,
0&&&& [0.401, 7.91]&&&&&&&&&&&&&&&&&&&&&&&&&&&&& 3&&&& (31, 512.329]1&&&& (31, 512.329]&&&&&&&&&&&&&&&&&&&& & &&&&& 4&&& (7.91, 14.454]2&&& (7.91, 14.454]&&&&&&&&&&&&&&&&&&&&&&&&&&&& 5&&& (7.91, 14.454]因为是bin,所以属性都是一个个区间,代表这个数据属于哪个区间。对于这样的数据,我们需要factorize下,转为数值型数据。
df['Fare_bin_id'] = pd.factorize(df.Fare_bin)[0]+1
scaler = preprocessing.StandardScaler()
df['Fare_bin_id_scaled'] = scaler.fit_transform(df.Fare_bin_id)
相关搜索:
相关阅读:
相关频道:
&&&&&&&&&&&&&&&&
Python教程最近更新「2017」&第110期&你的假期余额已经不足!
「2017」&第110期&你的假期余额已经不足!
不知不觉国庆中秋长假已经进入尾声......你的国庆假期是怎么过的?是这样还是这样假期即将结束温馨提示提醒返程自驾的小伙伴①路口不要超车;②请系好安全带;③不要连续变道;④高速不要违章停车;⑤跟车不要太近;⑥高速错过出口请将错就错到下一出口;⑦开车时别走神;⑧请勿酒后驾驶;⑨请正确使用远光灯;⑩儿童要坐安全座椅。应对“假期综合征”1及时调整作息,睡前可泡泡脚,有助睡眠;2调整饮食,尽量清淡,七分饱,吃蔬菜水果、稀饭等;3运动调整精神状态,适当给自己个缓冲期。快速进入工作状态将办公场所的环境进行下打扫,寻找一下工作的状态,同时与周围的同事进行一些工作上的交谈。检查下自己的工作邮箱,看看哪些邮件需要处理,回忆下之前的工作情景;到了工作岗位上,可以对假期前的工作和将要汇报的工作进行一下梳理,罗列出哪些工作需要完善的,从简单的入手,慢慢进入工作状态,调整身体的状态;工作一段时间后,可选用闭目养神、聆听舒缓一些的轻音乐、读书阅报等方式调整自己的身心。多看一些图片、图像等东西,也有助于大脑神经系统的恢复,这些都可帮助自己尽快进入正常工作状态。休息是为了更好地出发离全年结束进入倒计时让我们开启奋斗模式将假期积攒的幸福能量尽情释放化作前进的动力!(图文来源于网络)编辑:覃小玲
本文仅代表作者观点,不代表百度立场。系作者授权百家号发表,未经许可不得转载。
百家号 最近更新:
简介: 美丽有约,传播美丽新知
作者最新文章

参考资料

 

随机推荐