服务器之家

服务器之家 > 正文

Java编程通过匹配合并数据实例解析(数据预处理)

时间:2021-03-26 11:09     来源/作者:sober_qianyang

本文研究的主要是java编程通过匹配合并数据(数据预处理)的相关内容,具体如下。

数据描述

以下程序是对如下格式的数据进行合并处理。

Java编程通过匹配合并数据实例解析(数据预处理)

这个表的每一行表示用户id及用户的特征。其中,一个用户只有一个特征向量,即第一列不会重复。

Java编程通过匹配合并数据实例解析(数据预处理)

这张表的第一列,表示用户的id,第二列表示用户所看的电影,第三列表示用户对电影的打分(1-13分),第四列表示用户对电影的打分,但分值范围是1-5分。

问题描述

在做数据预处理时,如何将第二张表添加上用户特征呢?其实,方法很简单,将第二张表的用户id与第一张表的用户id进行匹配就行。合并结果如下图所示。

Java编程通过匹配合并数据实例解析(数据预处理)

数据处理程序

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
package deal;
import java.io.bufferedreader;
import java.io.file;
import java.io.fileinputstream;
import java.io.ioexception;
import java.io.inputstreamreader;
import java.math.bigdecimal;
import java.util.arraylist;
import java.util.hashmap;
import java.util.list;
/*
 * author:合肥工业大学 管院学院 钱洋
 * email:1563178220@qq.com
*/
public class getpuser {
    public static list<string> readdocs(string docspath,string code) throws ioexception{
        bufferedreader reader = new bufferedreader( new inputstreamreader( new fileinputstream( new file(docspath)),code));
        string s=null;
        list<string> userproductscore=new arraylist<string>();
        while ((s=reader.readline())!=null) {
            userproductscore.add(s);
        }
        reader.close();
        return userproductscore;
    }
    public static hashmap<string, string> mapread(string docspath1,string code1) throws ioexception{
        bufferedreader reader1 = new bufferedreader( new inputstreamreader( new fileinputstream( new file(docspath1)),code1));
        string s1=null;
        hashmap<string,string> userfeaturemap=new hashmap<string,string>();
        while ((s1=reader1.readline())!=null) {
            string arr[]=s1.split("\t");
            string feature="";
            for (int i = 1; i < arr.length; i++) {
                bigdecimal db = new bigdecimal(arr[i]);
                string ii = db.toplainstring();
                feature+=ii+" ";
            }
            userfeaturemap.put(s1.split("\t")[0], feature);
        }
        reader1.close();
        return userfeaturemap;
    }
    public static list<string> match(list<string> userproductscore,hashmap<string, string> userfeaturemap) throws ioexception{
        list<string> userscoreandfeature=new arraylist<>();
        for (int i = 0; i < userproductscore.size(); i++) {
            //获取用户id
            string user_id=userproductscore.get(i).split("\t")[0];
            //获取用户特征
            string userfeature = userfeaturemap.get(user_id);
            userscoreandfeature.add(userproductscore.get(i)+"\t"+userfeature);
            system.out.println(userproductscore.get(i)+"\t"+userfeature);
        }
        return userscoreandfeature;
    }
    public static void main(string[] args) throws ioexception {
        //读取两个文本
        list<string> userproductscore=readdocs("data/train/ydata-ymovies-user-movie-ratings-train-v1_0.txt","gbk");
        hashmap<string, string> userfeaturemap=mapread("data/fileofuser/yahoo.txt","utf-8");
        //匹配结果
        match(userproductscore,userfeaturemap);
    }
}

总结

以上就是本文关于java编程通过匹配合并数据实例解析(数据预处理)的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

原文链接:http://blog.csdn.net/qy20115549/article/details/59110167

标签:

相关文章

热门资讯

2020微信伤感网名听哭了 让对方看到心疼的伤感网名大全
2020微信伤感网名听哭了 让对方看到心疼的伤感网名大全 2019-12-26
yue是什么意思 网络流行语yue了是什么梗
yue是什么意思 网络流行语yue了是什么梗 2020-10-11
背刺什么意思 网络词语背刺是什么梗
背刺什么意思 网络词语背刺是什么梗 2020-05-22
Intellij idea2020永久破解,亲测可用!!!
Intellij idea2020永久破解,亲测可用!!! 2020-07-29
苹果12mini价格表官网报价 iPhone12mini全版本价格汇总
苹果12mini价格表官网报价 iPhone12mini全版本价格汇总 2020-11-13
返回顶部