暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
百度校园招聘笔试试题-软件研发工程师.doc
158
1页
0次
2021-02-22
40墨值下载
2014
百度笔试题(软件研发工程师)
一,简答题
(
本题共
30
)
1.
当前计算机系统一般会采用层次结构来存储数据,请介绍下典型的计算机存
储系统一般
分为哪几个层次,为什么采用分层存储数据能有效提高程序的执行效率
?(10
)
2. Unix/Linux
系统的僵尸进程是如何产生的
?
有什么危害
?
如何避免
?(10)
3.
简述
Unix/Linux
系统中使用
socket
库编写服务器程序的流程,请分别用对
应的
socket
通信函数表示。
二,算法与程序设计题
(
本题共
45
)
1
, 使用
C/C++
语言写一个函数,实现字符串的反转,要求不能用任何系统函
数,且时间复
杂度最小。函数原型是:
char *reverse_str(char *str)(15
)
2
, 给定一个如下输入格式的字符串,
(1
(2
3)
(4
(5
6)
7))
括号内的
元素可以是
数字,也可以另一个括号,请实现一个算法消除嵌套的括号。比如把上面的表
达式变成:
(1
2
3
4
5
6
7)
,如果表达式有误请报错。
(15
)
3
, 相似度计算用于衡量对象之间的相似程度,在数据挖据,自然语言处理中
使一个基础性
计算,在广告检索服务中往往也会判断网民检索
Query
和广告
Adword
的主题
相似度。假设
Query
或者
Adword
的主题属性定义为一个长度为
10000
的浮
点数据
Pr[10000](
称之为主题概率数组
)
,其中
Pr[i]
表示
Query
或者
Adword
属于主题
Id
i
的概率,而
Query
Adword
的相似度简化定义为两者主题概
率数组的内积,即
sim(Query,Adword)=sum(QueryPr[i]*AdwordPr[i])
(0<==i<10000).
在实际应用场景中,由于大多数主题的概率都为
0
,所以主
题概率数组往往比较稀疏,在实现时会以一个紧凑型数组
topic_info_t[]
的方
式保存,其中
100<=
数组大小
<=1000
,并按照
topic_id
递增排列,
0<=topic_id<10000,0
现在给出
Query
topic_info_t
数组和
N(N>=5000)
Adwords
topic_info-t
数组,现要求出
Query
Adwords
的相似度最大值,即
max(sim(Query,Adword[i])(0<=i& query_topic_info, Const vector
adwords_topic_info[], Int adwords_number);
编写代码求时间复杂度最低的算法,并给出时间复杂度分析。
(15
)
三,系统设计题
(
本题共
25
)
在企业中,对生产数据进行分析具有很重要的意义。但是生产数据通常不能直
接用于数据分析,通常需要进行抽取,转换和加载,也就是业界常识的
ETL
of 1
40墨值下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜